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= (54) Titre: PROCBDB D'OBTENTION D'ACIDES NUCLEIQUES A PARTIR D'UN ECHANTILLON DE L'ENVIRONNE- 
MENT, ACIDES NUCLEIQUES AINSI OBTENUS ET LEUR APPLICATION A LA SYNTHESE DE NOUVEAUX COMPOSES 



(57) AlMtract: The invention concerns a method for preparing nucleic acids from an environment sample, more particularly a method 
for obtaining a library of nucleic acids bom a sample. The invention also concerns nucleic acids of nucleic acid libraries obtained 
by said method their use in the synthesis of novel compounds, in particular novel compounds of therapeutic interest The invent 
further concerns novel means used in the method for obtaining said nucleic adds, such as novel vectors and novel processes for 
preparing such vectors or recombinant host cells containing said nucleic acid, finally, the invention concerns methods for detecting 

^ a nucleic acid of interest within a library of nucleic acids resulting from said method, and nucleic acids detected by said method and 

^ polypeptides encoded by siaid nucleic acids. 

0^ (57) Abr£g£: La pr^nte invention conceme un procfidfi de preparation d'acides nucl6iques h partir d'un Echantillon de I'environ- 
^ nement, plus particuli&rement un proc£d£ d'obtention d'une collection d'acides nucl£iques & partir d'un echantillon. L'invention 
^ est ^galement relative aux acides nucl£iques ou aux collections d'acides nncl^iqnes obtenus selon le proc^de et leur application a 
la synth&se de nouveaux composes, notamment de nouveaux compost d'interet thfrapeutique. L'invention a egalemenl pour objet 
les moyens nouveaux mis en oeuvie dans le proc£d€ d'obtention d'acides nuclSques ci-dessus, tels que de nouveaux vecteurs et des 
nouveaux proc£d£s de preparation de tels vecteurs ou encore des cellules hdtes recombinantes comprenant un acide nucl^ique de 
Q l'invention. L'invention conceme encore des precedes pour detecter un acide nucMique d'intfiret an sein d'une collection d'acides 
^ nucldiques obtenus selon le proc6d6 ci-dessus, ainsi que les acides nucleiques d^tect^s par un tel proc^de et les polypeptides codes 
^ par de tels acides nucldiques. 
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(AT, BE, CH, CY, DE, DK, ES, H, FR, GB, GR. IE, IT. LU, 
MC, ML, PT, SE, TR), brevet OAK (BF, BJ, CF, CO, CI, 
CM, OA, ON, GW, ML, MR, NE, SN, TD, TG). 

PubU«e: 

— Sans rapport de recherche intemationale, sera republUe 
dis riception de ce rapport. 



En ce qui conceme les codes a deux lettres et autres abr4via- 
tions, se rifirer aux "Notes aplicatives relatives aux codes et 
abriviations' ftgurant au dibul de chaque numdro ordinaire de 
la Gazette du PCT. 
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Proced6 d'obtention d'acides nucleiques ^ partir d'un 
§chantillon de renvironnement, acides nucleiques ainsi obtenus 
et leur application a la synthase de nouveaux composes 

s La pr^sente invention conceme un proc6d§ de preparation 

d'acides nucleiques S partir d'un ^chantillon de I'environnenfient, plus 
particuli^rement un proced6 d'obtention d'une collection d'acides 
nucleiques a partir d'un 6chantillon. L'invention est 6galement relative 
aux acides nucleiques ou aux collections d'acides nucleiques obtenus 

10 selon le proc^de et leur application d la synthase de nouveaux 
composes, notamment de nouveaux composes d'interet therapeutique. 

L'invention a egalement pour objet les moyens nouveaux mis 
en oeuvre dans le precede d'obtention d'acides nucleiques ci-dessus, 
tels que de nouveaux vecteurs et des nouveaux procedes de preparation 

IS de iels vecteurs ou encore des cellules hdtes recombinantes 
comprenant un acide nucieique de {'invention. 

L'invention conceme encore des precedes pour detecter un 
acide nucieique d'interet au sein d'une collection d'acides nucleiques 
obtenus selon le precede ci-dessus, ainsi que les acides nucleiques 

20 detectes par un tel precede et les polypeptides cedes par de tels acides 
nucleiques. 

L'invention a egalement trait & des acides nucleiques obtenus 
et detectes selon les precedes ci-dessus, en particulier des acides 
nucleiques codant pour une enzyme participant ^ la vote de biosynthese 

23 d'antibiotiques tels que les p-lactames, les aminoglycosides, les 
nucleotides heterocycliques ou encore des polyketides ainsi que 
I'enzyme cedee par ces acides nucleiques, les polyketides produits 
grdce d I'expression de ce.s acides nucleiques et enfin des compositions 
pharmaceutiques comprenant une quantite phannacelegiquement active 

30 d'un polyketide produit grace a I'expression de tels acides nucleiques. 

Depuis la decouverte de la production de la streptomycine par 
les actinomycetes, la recherche de nouveaux composes d'interet 
therapeutique, et tout particulierement de nouveaux antibiotiques, a eu 
recours de maniere accme i des methodes de criblage des metabolites 

3S produits par les micro-erganismes du sol. 
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De telles m6thodes consistent principalement d isoler les 
organismes de la microflore tellurique. d les cultiver sur des milieux 
nutritlfs sp6cialement adapt6s . puis d d6tecter une activity 
phannacologique dans les produits retrouvSs dans les surnageants de 
5 culture ou dans les lysats cellulaires ayant, le cas 6ch6ant, sub! au 
pr6alable une ou plusieurs 6tapes de separation et/ou de purification. 

Ainsi, les m6thodes d'Isolement et de culture in vitro des 
organismes constituent la microflore tellurique ont permis, d la date 
d'aujourd'hui, de caract6riser environ 40.000 molecules, dont environ la 
10 moitid pr^sente une activity biologique. 

Des produits majeurs ont 6te caract6ris6s selon de telles 
m§thodes de culture in vitro, tels que des antibiotiques (p^nicilline, 
^rythromycine, actinomycine, tetracycline, cephalosporine), des anti- 
cancereux, des anticholestdroiemiants ou encore des pesticides. 
IS Les produits d'int§rdt thSrapeutique d'origine microbienne 

connus d ce jour proviennent majoritairement (environ 70%) du groupe 
des actinomyc6tes et plus particulierement du genre Streptomyces. 
Toutefois, d'autres composes th6rapeutiques. tels que les teicoplanines, 
la gentamycine et les spinosines, ont 6te isoles d partir de micro- 
20 organismes de genres plus difficiles a cultiver tels que Micromonospora, 
Actinomadura, Actinoplanes, Nocardia, Streptosporangium, 
Kitasatosporia ou encore Saccharomonospora. 

Mais la pratique illustre le fait que la caracterisation de 
nouveaux produits naturels synthetisSs par les organismes de la 
25 microflore du sol est rest^e limitSe, en partie du fait que I'etape de 
culture In vitro aboutit le plus souvent d une selection d'organismes d^jd 
connus anterieurement. 

Les m6thodes de separation et de culture in vitro des 
organismes telluriques en vue d'identifier de nouveaux composes 
30 d'interet presentent done de nombreuses limites. 

Chez les actinomyc6tes, par exemple, le taux de red6couverte 
d'antibiotiques d6j^ connus anterieurement est d'environ 99%. En effet, 
des techniques de microscople en fluorescence ont permis de 
denombrer plus de 10^° cellules bact§riennes dans 1g de sol, alors que 
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seulement 0,1 d 1% de ces bacteries peuvent Stre isolees apr6s 
ensemencement sur des milieux de culture. 

A I'aide de techniques de cin^tique de r^association d'AON, il a 
pu §tre montrS qu'entre 12.000 et 18.000 esp&ces bact^riennes peuvent 
s §tre contenues dans 1g de sol, alors qu'd ce jour, seuls 5000 micro- 
organismes non eucaryotes ont §t6 dScrits, tout habitat confondu. 

Des etudes d'ecologie mol6culaire ont pemiis d'amplifier et 
doner de nombreuses sequences nouvelles d'ADNr 16S S partir d'ADN 
de renvironnement. 

10 Les r6sultats de ces etudes ont conduit d tripler le nombre de 

divisions bact6riennes caracteris6es ant6rieurement. 

A la date d'aujourd'hui, les bacteries sont subdivis^es en 40 
divisions, certaines d'entre elles n'6tant constitutes que par des 
bactSries ne pouvant Stre cultivtes. Ces demiers rtsultats ttmoignent de 
IS I'ampleur de la biodiversity microbienne restte inexploit§e d ce jour. 

Des travaux rgcents ont tente de sumnonter les nombreux 
obstacles d I'acc^s a la biodiversity de la microflore du sol, dont 
notamment l'6tape de culture in vitro prtalable §i I'isolement et la 
caracttrtsation de composes d'inttret industriel, surtout d'intyrdt 
20 thtrapeutique. 

Des methodes ont ainsi 6t§ mises au point qui incluent une 
6tape d'extractlon de I'ADN des organismes telluriques, le cas echfeant 
aprfes un isolement prealable des organismes contenus dans les 
echantillons de sol. 

25 L'ADN ainsi extrait, aprts lyse des cellules bacttriennes sans 

ytape prtalable de culture' in vitro, est clon6 dans des vecteurs utilises 
pour transfecter des organismes hdtes, afin de constituer des banques 
d'ADN provenant de bacteries du sol. 

Ces banques de clones recombinants sont utiiistes pour 

30 d6tecter la presence de g6nes codant pour des composts d'inttrfit 
thtrapeutique ou alternativement pour dttecter la production de 
composts d'inttrtt thtrapeutique par ces clones recombinants. 

Toutefois, les methodes d'accts direct d I'ADN de la microflore 
du sol, dtcrites dans I'ttat de la technique prtsentent des inconvtnlents 

35 lors de la mise en oeuvre de chacune des ttapes dtcrites ci-dessus. de 
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nature d affecter consid^rablement la quantity et la qualite du materiel 
g§n§tique obtenu et exploitable. 

L'^tat de la technique concernant chacune des stapes de 
construction de banques d'ADN provenant d'6chantillons de sol est 
s d6taill§ ci-aprSs. ainsi que les inconv§nients techniques identifies par le 
demandeur et qui ont §t6 sunmont^s selon la prSsente invention. 



1. Etape d'extraction de I'ADN a partir d'un dchantillon du 

10 sol. 

1.1 Extraction directe d'ADN de I'envlronnement 

II s'agit pour I'essentiel d'un proc^^ mettant en oeuvre des 

IS techniques d'extraction d'ADN rSalisSes directement sur l'§chantillon 
dans I'environnement, le plus souvent apr^s une lyse in situ prealable 
des organismes de r§chantillon. 

De telles techniques ont 6t6 mises en oeuvre sur des 
6chantillons provenant de milieux aquatiques, que ce soit d'eau douce 

20 ou marine. Elles comprennent une premiere etape de concentration 
prealable des cellules prSsentes librement ou sous forme de particules, 
consistent en g^n^ral en une filtration de grands volumes d'eau sur 
diffdrents dispositife de filtration, par exemple filtration ciassique sur 
membrane, filtration tangentielle ou rotationnelle ou encore ultrafiltration. 

25 La taille des pores est comprise entre 0,22 et 0,45 mm et 

nScessite souvent une prSfiltration dans le but d'^viter des colmatages 
dus au traitement de grands volumes. 

Dans un second temps, les cellules r§colt6es sont lys^es 
directement sur les filtres dans des petits volumes de solutions, par 

30 traitement enzymatique et/ou chimique. 

Cette technique est par exemple illustr6e par les travaux de 
STEIN et al. , 1996, Journal of Bacteriology. Vol.178 (3): 591-599 qui 
decrit le clonage de g^nes codant pour de I'ADN ribosomal et pour un 
facteur d'elongation de la transcription (EF 2) d partir d'Archaebacteries 

35 du plancton marin. 
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Des techniques d'extraction directe d'ADN d partir 
d'^chantillons de sol ou de sediment ont 6t6 dgalement decrites, bashes 
sur des protocoles de lyse physique, chimique ou enzymatique rSalis^e 
in situ. 

5 Par exemple, le brevet US N"'5,824,485 (Chromaxome 

Corporation) decrit une lyse chimique des bact6ries directement sur 
Techantillon prelev6 par addition d'un tampon de lyse chaud d base 
d'isothiocyanate de guanidlum. 

La demande Internationale n'WO 99/20.799 (WISCONSIN 
10 ALUMNI RESEARCH FOUNDATION) d§crit une 6tape de lyse des 
bactSries in situ d I'aide d'un tampon d'extraction contenant une 
protease et du SDS. 

D'autres techniques ont ^galement et6 utiiis^es telles que la 
realisation de plusieurs cycles de cong6lation-d6cong§iation de 
IS I'echantillon puis pressage de I'^chantillon decongel^ d haute pression. 
Ont §te Sgalement utilis^es des techniques de lyse des bact^ries d I'aide 
d'une succession d'etapes de sonication, de chauffage par micro-ondes 
etde chocs thermiques (PICARD et al. (1992). 

Toutefois, les techniques d'extraction directe d'ADN de I'^tat de 
20 la technique decrites ci-dessus ont une efficacitS tr^s variable du point 
de vue quantitatif et qualitatif. 

Ainsi, les traitements chimiques ou enzymatiques in situ de 
I'echantillon ont le d^savantage de ne lyser que certaines categories de 
micro-organismes du fait de la resistance selective des differents micro- 
25 organismes indigenes e I'etape de lyse en raison de leur morphologie 
heterogene. 

Ainsi, les bacteries d Gram-positif resistent A un traitement d 
chaud au detergent SDS alors que la quasi-totalite des cellules d Gram- 
negatif sont lysees . 
30 En outre, certains des protocoles d'extraction directe d6crits ci- 

dessus favorisent Tadsorption des acides nucieiques extraits sur les 
particules min6rales de I'echantillon, reduisant ainsi significativement la 
quantite d'ADN accessible. 

Par ailleurs, si certains protocoles de I'etat de la technique 
35 divulguent une etape de traitement mecanique pour lyser les micro- 
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organismes de I'^chantillon pr6tev6, une telle etape de lyse mScanique 
est syst^matiquement effectu^e en milieu liquide dans un tampon 
d'extraction, ce qui ne pemnet pas une bonne homogdn^isation de 
rechantillon de depart sous la fonne de particules fines pennettant une 
5 accessibility maximale d la diversity des organismes presents dans 
rechantillon. Des essais de broyage ont §galement 6t6 effectu6s sur 
§chantillon de sol brut d I'aide de billes de verre. mais la quantity d'ADN 
extrait 6tait faible. 

II a 6t6 observe selon I'invention qu'une premiere etape de lyse 
10 m6canique in situ en milieu liquide avait des effets nSgatifs sur la 
quantity d'ADN susceptible d'§tre extrait. 

La quantity d'ADN directement utilisable pour le clonage dans 
des vecteurs recombinants est ygalement tributaire des stapes de 
purification subsSquentes d son extraction. 
IS Dans t'ytat de la technique. I'ADN extrait est ensuite purifiy, par 

exemple par I'utilisation de.polyvinylpolypyn-olidone, par une precipitation 
en presence d'acetate d'ammonium ou de potassium, par des 
centrifugations sur gradient de chlorure de cesium, ou encore des 
techniques chromatographiques, notamment sur support 
20 d'hydroxyapatite, sur colonne 6changeuse d'ions ou encore tamisage 
moleculaire ou par des techniques d'6lectrophorese sur gel d'agarose. 

Les techniques de purification d'ADN d§crites anterieurement, 
surtout lorsque celles-ci sont combin^es avec les techniques d'extraction 
d'ADN de I'environnement prycityes, sont susceptibles de conduire k 
2S une co-purification de I'ADN avec des composys inhibiteurs provenant 
de rychantillon initial qui sont difriciles d yiiminer. 

La co-extraction de composys inhibiteurs avec I'ADN nycessite 
la multiplication du nombre d'etapes de purification ce qui conduit d des 
pertes importantes de I'ADN initialement extrait et ryduit simultanyment 
30 la diversity du materiel gyn^tique initialement contenu dans rechantillon, 
ainsi que sa quantity. 

Un autre but de I'invention a yty de surmonter les inconvynients 
des protocoles de purification antyrieurs et de mettre au point une ytape 
de purification d'ADN penpettant de maintenir de maniyre optimale la 
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diversity de I'AON de I'Schantillon initial, d'une part, et, de favoriser 
quantitativement son obtention, d'autre part. 

Tout particuiiSrement, les ameliorations qualitatives et 
quantitatives ^ la purification d'AON sont maximales lorsqu'elles font 
5 appel k une combinaison d'un proc6d6 d'extraction direct de I'ADN selon 
I'Invention et d'un proc6d6 de purification ult6rleur, comme cela sera 
d§crit ci-apr§s. 

1.2. Extraction indirecte d'ADN de I'environnement 

10 

De telles techniques ont recours d une premiere 6tape de 
separation des diff^rents organismes de la micropore tellurique des 
autres constituents de rechantillon de depart, pr^alablement d I'etape 
d'extraction de I'ADN proprement dite. 

IS Dans i'^tat de la technique, la separation prSalable d'une 

fraction microbienne d'un echantillon de sol comprend le plus souvent 
une dispersion physique de I'Schantillon par broyage de ce dernier en 
milieu liquide, par exemple en utilisant des dispositifs du type Waring 
Blender ou encore un mortier. 

20 II a egalement 6t6 decrit des dispersions chimiques, par 

exemple sur des r^sines echangeuses d'ions ou encore des dispersions 
d I'aide de detergents non specifiques tels que le deoxycholate de 
sodium ou du polyethylene glycol. Quel que soit le mode de dispersion, 
rechantillon solide doit §tre mis en suspension dans de I'eau. du tampon 

25 phosphate ou une solution saline. 

L'etape de dispersion physique ou chimique peut §tre suivie 
d'une centrifugation sur gradient de densite permettant la separation des 
cellules contenues dans rechantillon et des particules de ce dernier, 
etant entendu que les bacteries ont des densites inferieures d celles de 

30 la plupart des particules du sol. 

L'etape de dispersion physique peut aussi etre suivie 
alternativement d'une etape de centrifugation e faible Vitesse ou encore 
une etape d'eiutriation cellulaire. 

L'ADN peut ensuite etre extrait des cellules separees par toutes 
. 35 les methodes de lyse disponibles et etre purifie par de nombreuses 
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m^thodes, y compris les m§thodes de purification d^crites au 
paragraphs 1.1 pr^c^dent. Notamment, {'inclusion des cellules dans de 
{'agarose d bas point de fusion peut §tre realis^e afin de manager la 
lyse. 

5 Toutefois, les mSthodes dScrites dans I'^tat de la technique 

connues du demandeur ne donnent pas satisfaction du fait de la 
presence, dans les fractions contenant I'ADN extrait, de constituants 
ind^sirables de I'^chantillon de depart ayant une influence significative 
sur la quality et la quantity d'ADN final. 
10 La pr^sente invention se propose de r^soudre les difficult^s 

techniques rencontrSes dans les procSd^s de I'art ant^rieur comme cela 
sera ddcrit ci-aprds. 

2. Caract6risatioh moleculaire de I'ADN extrait. 

15 

Lorsque i'on desire construire une banque d'ADN d partir d'un 
6chantiIlon de Tenvironnement, en particulier d partir d'un 6chantillon de 
sol, il est avantageux de verifier la quality et la diversite de la source 
d'ADN extrait et purifi6 prealablement a son insertion dans des vecteurs 

20 appropri^s. 

L'objectif d'une telle caract^risation moleculaire de I'ADN extrait 
et purifi^ est d'obtenir des profils repr^sentant les proportions des 
difF^rents taxons bact§riens presents dans cet extrait d'ADN. La 
caractdrisation moleculaire de I'ADN extrait et purifid permet de 

25 determiner si des artefacts ont ete Introduits lors de la mise en oeuvre 
des differentes etapes d'extraction et de purification et, le cas echeant, si 
la diversite d'origlne de I'ADN extrait et purifie est representative de la 
diversite microbienne presente initialement dans I'echantillon, 
notamment dans I'echantillon de sol. 

30 A la connaissance du demandeur, il est recouru dans I'etat de 

la technique d des precedes d'hybridation quantitative mettant en oeuvre 
des sondes oligonucieotidiques specifiques de differents groupes 
bacteriens. appliques directement d I'ADN extrait de I'environnement. 
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Malheureusement, une telle approche est peu sensible et ne 
permet pas de dStecter des genres ou des groupes taxonomiques 
presents en falble abondance. 

L'^at de la technique dScrit aussi des precedes de PGR 
s quantitative, telle que la MPN-PCR ou encore la PGR quantitative par 
competition. Toutefois, ces techniques pr^sentent d'importants 
inconvenients. 

Ainsi, la MPN-PCR est d'une utilisation complexe du fait de la 
multiplication des dilutions et des repetitions qui la rend inappropriSe 

10 pour un grand nombre d'echantillons ou de couples d'amorces. 

Par ailleurs, la PGR quantitative par competition est d'une mise 
en oeuvre difficile du fait de la necessity de construire un competiteur 
sp^cifique d I'ADN cible qui, en outre, n'induit pas de biais ou d'artSfacts 
dans la competition proprement dite. 

IS II est ainsi propose selon I'invention un precede de precriblage 

d'une banque d'ADN provenant d'un echantilion de I'environnement qui 
est d la fois rapide, simple et fiable et pemnet de tester la qualite de 
I'ADN prealablement extrait et purifie et de determiner ainsi I'interet de 
construire une banque de clones prepares a partir de cet ADN purifie de 

20 depart. 

3. Vecteurs pour le clonage de I'ADN extrait et purifie ik 
partir d'un echantilion de renvironnement . 

2s De nombreux vecteurs ont dejd ete decrits dans retat de la 

technique afin de doner de I'ADN prealablement extrait d'un echantilion 
de I'environnement. 

Ainsi, selon la description de la demande Internationale n°WO 
99/20.799. peuvent etre utilises des vecteurs viraux, des phages, des 

30 plasmides, des phagemides, des cosmides, des phosmides, des 
vecteurs du type BAG (chromosome artificiel bacterien) ou encore le 
bacteriophage P1, des vecteurs de type PAG (chromosome artificiel 
base sur le bacteriophage P1), des vecteurs du type YAG (chromosome 
artificiel de levure), des plasmides de levure ou tout autre vecteur 
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capable de maintenir et d'exprimer de manidre stable un ADN 
g^nomique. 

L'exemple 1 de la demande PCT n'WO 99/20.799 d^crit la 
constaiction d'une banque d'ADN g^nomique par clonage dans un 
s vecteur du type BAC. 

A la connalssance du demandeur, aucune banque d'ADN 
provenant d'un echantillon de renvironnement n'avait encore 6te 
effectivement r6alis6e avec des vecteurs de type conjugatif, une telle 
technique etant rendue pour la premiere fois accessible et reproductible 
10 par rhomme du metier grace ^ Tenseignement de la pr^sente Invention. 

4. Hotes cellulaires 

Dans I'etat de la technique, de nombreuses cellules hotes ont 
IS 6t6 d^crites comme pouvant @tre utilisSes afin d'h§berger les vecteurs 
contenant les inserts d'ADN provenant de I'ADN extrait et purifi§ d partir 
d'un 6chantillon de I'environnement. 

Ainsi, la demande PCT N'WO 99/20.799 cite de nombreux 
hStes cellulaires appropri^s, tels que Escherichia coli, en particulier la 
20 souche DH 10B ou encore la souche 294 (ATCC 31446, la souche E. 
coli B. E. Coli X 1776 (ATCC N*'31.537), E.coli DH5 a et E.coli W3110 
(ATCC n»27.325). 

Cette demande PCT cite Sgalement d'autres cellules hotes 
appropriSes telles que Entembacter. Erwinia. Klebsiella, Proteus, 
25 Salmonella, Serratia, Schigella ou encore des souches du type bacillus 
telles que B. subtilis et B. licheniformis ainsi que les bactdries du genre 
Pseudomonas, Streptomyces ou Actinomyces. 

Le brevet US N''5,824,485 cite en particulier la souche de 
Streptomyces lividans TK66 ou encore des cellules de levure telles que 
30 celles de Saccharomyces pombe. 

5. Caract6risation de genes d'interet dans des banques 
d'ADN provenant d'un echantillon de I'environnement 
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La demande PCT N" WO 99/20.799 dScrit une identification du 
phSnotype de diff^rents clones appartenant d la banque d'ADN de 
B.cereus, respectivement un clone produisant de I'h^molysine, un clone 
hydrolysant I'esculine ou encore un clone produisant un pigment orange. 

5 Des techniques de mutagenSse bashes sur rutilisation d'un 

transposon codant pour I'enzyme pho A ont permis subs6quemment 
d'isoler des clones mut^s et de caract^riser les sequences responsables 
des ph6notypes observ6s. 

L'article de STEIN et al. (1996) precite decrit Tutilisation 

10 d'amorces sp6cifiques de I'ADN ribosomal afin d'amplifier I'ADN Ins6r6 
dans les vecteurs h6berg6s par certains clones d'une banque d'ADN 
gSnomique d'ArchaebactSries de plancton marin et I'ldentification de 
plusieurs sequences codantes dans I'ADN ainsi amplifi^. 

L'article de BORSCHERT S. et al., (1992) decrit le criblage 

IS d'une banque d'ADN g6nomlque de Bacillus subtilis d I'aide de couples 
d'amorces hybridant avec des regions consen/6es de peptide 
synthetases connues afin d'identifier un ou plusieurs gSnes 
con-espondant dans le g6nome de Bacillus subtilis. 

Cette technique a permis de d^tecter un fragment d'ADN 

20 chromosomique d'environ 26 kb portant une partie de I'opdron de 
biosynth^se de la surfactine. 

L'article de KAH-TONG S. et al.(1997) decrit le criblage d'une 
banque d'ADN provenant du sol d I'aide d'amorces hybridant avec des 
sequences conserv§es de I'opdron responsable de la vote de 

23 biosynthSse des polykStides de type II et montre I'ldentification, au sein 
de cette banque d'ADN, de sequences apparent^es au g6ne PKS-p. Cet 
article decrit aussi la constaiction de cassettes d'expression hybrides 
dans lesquelles la sequence de la sous-unite PKS-p, retrouv§e 
naturellement dans I'operon responsable de la blosynthdse des 

30 polyk6tides, a 6t§ remplac6e par diff^rentes sequences apparent6es 
retrouvees dans la banque d'ADN. 

De mfime, l'article de HONG-FU et al. . (1995) d6crit la 
construction de cassettes d'expression contenant les dlff6rentes phases 
de lecture ouverte de I'operon responsable de la biosynth^se des 

3S polyk6tides, les diff^rentes cassettes d'expression ayant et6 construites 
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artificiellement en combinant les phases de lecture ouverte qui ne sont 
pas retrouvSes ensemble naturellement dans le g§nome de 
Streptomyces coelicolor. Get article montre que la combinaison, dans les 
cassettes d'expression artificielles, de cadres de lecture ouvert 
s originaires de differentes souches bact^riennes pernrtet la production de 
polyketldes ayant diff§rentes caract^ristiques structurales et des activitSs 
antibiotiques plus ou moins grandes vis-d-vis de Bacillus subtilis et 
Bacillus cereus. 

Les polyk6tides font partie d'une grande famille de produits 

10 naturels de structure variable et poss^dant une grande diversite 
d'activit^s bioiogiques. Font partie des polyk6tides par exemple, les 
tetracyclines et I'Srythromycine (antibiotiques), le FK506 
(immunosuppresseur), la doxorubicine (agent anti-canc§reux), la 
monensine (un agent coccidiostatique) ainsi que I'avemnectine (un agent 

13 antiparasitaire). 

Ces molecules sont synth6tis§es grSce ^ des enzymes 
multlfonctionnelles appelees polyketldes synthases, qui catalysent des 
cycles de condensation r^pSt^s entre des acyl thioesters (en general des 
acetyl, propionyl, malonyl ou m6thylmalonyl thioesters). Chaque cycle de 

20 condensation aboutit d la fomiation, sur une chaTne croissante carbon^e, 
d'un groupe p-keto qui peut ensuite subir, le cas ^ch^ant, une ou 
plusieurs series d'etapes rSductrices. 

Compte-tenu de I'int6r3t clinique important des polyketldes, leur 
m§canisme commun de biosynthSse ainsi que le haut degre de 

25 conservation observe entre les groupes de gdnes codant pour les 
polyketldes synthases, il s'est developpe un interSt accru pour le 
developpement de nouveaux polyketldes par genie genetique. 

De nouveaux polyketldes artificiels ont ainsi ete produits par 
g6nie genetique, tels que la mederrhodine A ou la dihydrogranatirhodine. 

30 La grande majorite des molecules nouvelles de polyketldes obtenues par 
genie genetique sont tres differentes, du point de vue structural, des 
polyketldes correspondents naturels. 

De retat de la technique, 11 ressort ainsi qu'il existe un besoin 
d'obtention de nouveaux polyketldes d'interSt et tout particulierement de 

3S polyketldes d'interdt therapeutique presentant notamment, par rapport d 
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leurs homologues naturels, un niveau accru d'activit^ antibiotique ou 
encore un spectre d'activitS antibiotique different, soit plus large que 
celui des polyk^tides connus, soit au contraire plus s6lectif. 

Ce besoin est, comme cela sera d^crit ci-aprSs, en partie 
5 combIS selon la prSsente invention. 

DESCRIPTION DE ^INVENTION 

L'invention concerne tout d'abord un proc6d§ pour la 

10 construction de banques d'ADN provenant d'un echantillon de 
I'environnement. un tel Echantillon pouvant Stre indiffSremment un milieu 
aquatique (eau douce ou marine), un Echantillon de sol (couche 
superficielle du sol, sous-sol ou sediments), ou encore un Echantillon 
d'organlsmes eucaryotes contenant une microflore associEe, tel que par 

IS exemple un Echantillon provenant de plantes, d'insectes ou encore 
d'organismes marlns et possEdant une microflore associEe. 

La mise au point d'un procEdE de construction d'une banque 
d'ADN d'un Echantillon de I'environnement. et tout particulierement d'un 
echantillon de sol. comprend des Etapes critiques dont la mise en oeuvre 

20 doit etre nEcessairement optimisee pour robtention d'une banque d'ADN 
dont le contenu en acldes nuclEiques d'intErEt rEpond aux objectifs 
initialement fixEs. 

Une premiEre Etape critique consiste en I'extraction et la 
purification ultErieure des acides nuclEiques contenus initialement dans 

2S I'Echantillon. c'est-d-dire principalement des acides nuclEiques contenus 
dans les divers organismes composant la microflore de cet Echantillon. 

La qualite de la purification de I'ADN extrait est dEtenninante 
sur le rEsultat obtenu. 

Une seconde Etape importante d'un procEdE de construction 

30 d'une banque d'acides nuclEiques provenant d'un Echantillon de 
I'environnement est I'Evaluation de la diversitE gEnetique des acides 
nuclEiques extraits et purifies. La mise au point d'une Etape de 
rEalisation simple et fiable de pre-criblage de I'ADN extrait et purifiE afin 
de vErifier qu'il rend compte, au moins partiellement, de la diversitE 

3S phyiogEnEtique des organismes prEsents initialement dans I'Echantillon 
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de depart, permet en effet de determiner l'int§ret ou non d'utiliser la 
source initiale d'ADN extrait et purifiS pour la construction de la banque 
d'acides nucl^iques proprement dite ou au contraire de ne pas 
poursuivre la construction de la banque d'acides nucl§iques du fait 

s d'art^facts trop importants introduits au moment de {'extraction et de la 
purification des acides nucleiques. II a en outre §t6 identifi§ selon 
■'invention que la quality des inserts introduits dans les vecteurs pour 
construire la banque est determinante. II a ainsi 6t6 dSterminS que 
I'utilisation d'enzymes de restriction pour diver I'ADN extrait et purifi§ ei 

10 partir de I'^chantillon de I'environnement ^tait de nature d introduire des 
artefacts ou "biais" dans la structure des inserts obtenus. En effet, 
I'ADN extrait du sol ou d'autres environnements, provenant en tr§s 
grande majority d'organismes non cultivables, est composd de 
molecules dont !e taux de bases G et C est par definition inconnu et de 

IS plus variable en fonction de I'origine de ces organismes. 

Une troisidme Stape critique est I'insertion des acides 
nucleiques extralts et purifies dans des vecteurs capabies d'integrer des 
acides nucleiques de longueur choisie, d'une part, et, d'autre part, d'en 
permettre la transfection ou encore I'integration dans le g6nome dans 

20 des botes cellulaires determines ainsi que, le cas echeant, d'en 
permettre I'expression dans de tels hdtes cellulaires. 

Constituent des vecteurs d'inter§t, les vecteurs capabies 
d'integrer des acides nucieiques de grande taille, c'est-^-dire de taille 
superieure d 100 kb lorsque I'objectif poursuivi consiste en un clonage et 

25 en une identification d'un operon complet capable de diriger une vole 
complete de biosynthese d'un compose d'interet industriel, en particulier 
d'un compose d'interet pharmaceutique ou agronomique. 



DEFINITIONS 

Au sens de la presente invention, on entend par " acides 
nucleiques ", " polynucleotides " et " oligonucleotides " aussi bien des 
sequences d'ADN, d'ARN, que des sequences hybrides ARN/ADN de 
plus de 2 nucleotides, indifferemment sous la forme simple brin ou 
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Le terme " banque " ou " collection " est utilis6 dans la pr6sente 
description en r6f6rence indiffgremment d un ensemble d'acides 
nuclSiques extraits et, le cas ^ch^ant purifies, provenant d'un 6chantillon 
de renvironnement. d un ensemble de vecteurs recombinants, chacun 
5 des vecteurs recombinants de I'ensemble comprenant un aclde 
nuc!6ique provenant de I'ensemble d'acides nucl6iques extraits et, le cas 
6cheant purifies pr^cites, ainsi qu'd un ensemble de cellules hotes 
recombinantes comprenant un ou plusieurs acides nucl6iques provenant 
de I'ensemble des acides nucl6lques extraits et, le cas ech6ant, purifies 

10 pr6cit^s, iesdits acides nucl^iques 6tant soient port^s par un ou 
plusieurs vecteurs recombinants, soft int6gr§s dans le genome desdites 
cellules hdtes recombinantes. 

On d^signe par "6chantillon de I'environnement " 
indiff^remment un dchantillon d'origine aquatique, par exemple d'eau 

15 douce ou saline, ou un ^chantilton tellurique provenant de la couche 
superflcielle d'un sol, de sediments ou encore de couches infSrieures du 
sol (sous-sol), ainsi que des §chantillons d'organismes eucaryotes, le 
cas ech6ant multicellulaires, d'origine veg6tale, provenant d'organismes 
marins ou encore d'insectes et poss6dant une microflore associee, cette 

20 microflore associ6e constituant des organlsmes d'int6ret. 

On entend par " op6ron " selon I'invention, un ensemble de 
cadres ouverts de lecture dont la transcription et/ou la traduction est co- 
rSgul^e par un ensemble unique de signaux de r^ulation de la 
transcription et/ou de la traduction. Selon I'invention, un op^ron peut 

25 ^galement comprendre Iesdits signaux de r^ulation de la transcription 
et/ou de la traduction. 

Par " voie m6tabolique " aux fins de I'invention ou encore " voie 
de biosynth6se " on entend un ensemble de r§actions biochimiques 
anaboliques ou cataboliques r^alisant la conversion d'une premiere 

30 espece chimique en une seconde espece chimique. 

Par exemple, une voie de biosynthfese d'un antibiotique est 
constitute de I'ensemble des reactions biochimiques convertissant des 
metabolites primaires en produits tnterm^diaires des antibiotiques, puis 
subs§quemment en antibiotiques. 
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Par sequence de regulation placee " en phase " (en anglais 
operably linked) par rapport d una sequence nucl^otidique dent 
I'expression est recherchSe. on signifie que la ou les sequences de 
regulation de la transcription sont localis^es, par rapport d la s^uence 
s nucleotidique d'int^rgt dont I'expression est recherchde, de mani^re d 
permettre I'expression de ladite sequence d'interet, la regulation de la 
dite expression etant d^pendante de facteurs interagissant avec les 
sequences nucl^otidiques r^gulatrices. 

Selon une autre temiinologie, on peut dire §galement que la 
10 sequence nucleotidique d'int§r§t dont I'expression est recherch^e est 
placte " sous le contrdle " des s^uences nucldotidiques rSgulatrices de 
la transcription. 

Le terme " \so\6 " au sens de la presents invention d^signe un 
materiel bioiogtque qui a et§ soustralt d son environnement originel 
15 (I'environnement dans lequel il est localis6 naturellement). 

Par exemple, un polynucleotide ou un polypeptide present d 
retat naturel dans un organisme (virus, bact§rie, champignon, levure, 
plante ou animal) n'est pas isol6. Le m§me polypeptide s6pare de son 
environnement naturel ou le meme polynucleotide s^pard des acides 
20 nucieiques adjacents au sein desquels il est naturellement insure dans le 
genome de I'organisme, est isol6. 

Un tel polynucleotide peut etre inclus dans un vecteur et/ou un 
tel polynucleotide peut etre inclus dans une composition et demeure 
neanmoins d I'etat isoie, du foit que le vecteur ou la composition ne 
25 constitue pas son environnement naturel. 

Le terme " purifie " ne necessite pas que le materiel soit present 
sous une fomne de purete absolue, exclusif de la presence d'autres 
composes. II s'agit plutot d'une definition relative. 

Un polypeptide ou un polynucleotide est S I'etat purifie apr6s 
30 purification du materiel de depart d'au moins un ordre de grandeur, de 
preference 2 ou 3 et preferentiellement 4 ou 5 ordres de grandeur. 

Le " pourcentage d'identite" entre deux sequences de 
nucleotides ou d'acides amines, au sens de la presente invention, peut 
etre determine en comparant deux sequences alignees de maniere 
35 optimale, d travers une fenStre de comparaison. 
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La partie de la sequence nuclSotidique ou polypeptide dans la 
fen§tre de comparalson peut ainsi comprendre des additions ou des 
dd^tions (par exemple des "gaps") par rapport d la sequence de 
r^f^rence (qui ne comprend pas ces additions ou ces d6l§tions) de 
s maniSre S obtenir un alignement optimal des deux sequences. 

Le pourcentage est calcul6 en determinant le nombre de 
positions auquel une base nucl§ique ou un r^sidu d'aminoacide 
identique est observe pour les deux sequences (nucl6lque ou 
peptidique) compar6es, puis en divisant le nombre de positions auquel il 

10 y a identity entre les deux bases ou r^sidus d'aminoacides par le nombre 
total de positions dans la fenStre de comparalson, puis en multipliant le 
rSsultat par 100 afin d'obtenir le pourcentage d'identitS de sequence. 

L'alignement optimal des sequences pour la comparalson peut 
§tre r6alis§ de mani^re infomnatique d I'aide d'algorithmes connus 

IS contenus dans le package de la Soci6t§ WISCONSIN GENETICS 
SOFTWARE PACKAGE, GENETICS COMPUTER GROUP (GCG), 575 
Science Doctor, Madison, WISCONSIN. 

A titre d'lllustration, le pourcentage d'identlte de sequence 
pourra etre effectu6 d I'aide du logiciel BLAST (versions BLAST 1 .4.9 de 

20 Mars 1996, BLAST 2.0.4. de F6vrier 1998 et BLAST 2.0.6. de 
Septembre 1998), en utilisant exclusivement les param^tres par ddfaut 
(S.F. Altschul et al., J. Mol. Biol. 1990 215: 403-410. S. F. Altschul et al.. 
Nucleic Acids Res. 1997 25: 3389-3402). Blast recherche des 
sequences similaires/homologues d une s^uence "requite" de 

25 rifSrence, ^ I'aide de I'algorithme d'Altschul et al. La sequence requite 
et les bases de donnies utilisies peuvent Stre peptidiques ou 
nucliiques, toute combinaison 6tant possible. 

EXTRACTION ET PURIFICATION D'ACIDES NUCLEIQUES 
30 PROVENANT D'UN ECHANTILLON DE L'ENVIRONNEMENT. 

1. Extraction directe d'acides nucleiques 

II a §t6 montr§ selon la pr6sente invention que, pour I'obtention 
3S d'une banque d'acides nucliiques provenant d'organismes contenus 
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dans un 6chantillon du sol, il 6tait Important de cr6er des conditions dans 
lesquelles, d'une part, les diff6rents organismes de l'6chantillon sont 
rendus accessibles aux stapes ult6rieures d'extraction des acides 
nucl6iques et, d'autre part, que I'etape initiale de traitement de 
5 l'6chantillon de sol penmette une lyse mecanique maximale des 
organismes de r§chantillon de nature ^ rendre directement accessibles 
les acides nucl6iques de ces organismes, principalement I'ADN 
g6nomique et plasmidique, aux tampons utilises pour les etapes 
ultSrIeures d'extraction. 

JO II a 6t6 ainsi d§montr6 selon I'invention qu'une accessibility 

maximale des acides nucl6iques provenant des micro-organismes d'un 
^chantillon du sol &a\t atteinte par un broyage pousse et d sec de 
r6chantillon de sol pr6alablement s6ch6 afin d'obtenlr des micro- 
particules. Le demandeur a aInsI determine que le s^chage de 

15 r^chantillon de sol pr^alable a tout traitement ult^rieur provoque une 
diminution significative de la cohesion de I'^chantillon de sol brut et 
favorise en consequence sa desagr6gation ulterieure sous la fomie de 
micro-particules, lorsqu'un traitement par broyage approprie est op§r6. 

De manidre surprenante, le demandeur a montr6 que des 

20 micro-particules d'^chantiltons de sol sec reunissaient des propri6t§s 
physico-chimiques favorables d I'extraction d'une quantity optimale 
d'acides nuclSiques qui, dans leur nature, pouvalent §tre repr^sentatife 
de la diversity g§n6tique des organismes presents Initialement dans 
l'6chantlllon de sol de depart. II a 6te montr§ en partlculier que le 

25 precede d'extraction directe d'acides nucteiques selon I'invention 
pennettait I'extraction d'ADN provenant de micro-organismes rares, tels 
certains Streptomyces rares ou des micro-organismes sporulSs. 

Par " micro-particules " de l'6chantillon de sol aux fins de la 
presente invention, on entend des particules d6rivees de l'6chantillon 

30 ayant une taille moyenne d'environ 50 pm, c'est d dire comprise en 
moyenne entre 45 et 55 pm/. 

Selon I'invention, les micro-particules sont obtenues d partir 
d'6chantlllons de sol pr6alablement s6ch6s ou dessiqu6s puis broy6s 
jusqu'i I'obtention de micro-particules de taille moyenne comprise entre 
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2|jm et 50Mm, avant remise en suspension dans un milieu tampon 
liquide des micro-particules obtenus. 

Un tel milieu tampon liquide peut consister en un tampon 
d'extraction d'acides nucleiques, en particulier un tampon d'extraction 
5 d'ADN conventionnel bien connu de I'homme du m§tier. 

Le broyage de r^chantillon de sol en micro-particules a pour 
double fonction de lyser m6caniquement la majorite des organlsmes 
presents dans I'Schantillon de sol initial et de rendre accessibles les 
organismes non lyses par ce traitement m6canique d des stapes 

10 facultatives ult6rieures de lyse chimique et/ou enzymatique. 

Ainsi, un premier objet de I'lnvention consiste en un proc§d6 de 
preparation d'une collection d'acides nucleiques d partir d'un 6chantillon 
de sol contenant des organismes. ledit procddS comprenant une 
premiere §tape (l-(a)) d'obtention de micro-particules par broyage de 

IS rechantillon de sol pr^alablement sech6 ou dessiquS, puis mise en 
suspension des micro-particules dans un milieu tampon liquide. 

De maniSre tout d fait pref^r^e, retape de broyage est rSalisee 
d I'aide d'un disposltif S billes d'agate ou de tungstdne ou encore S I'aide 
d'un dispositif a anneaux de tungst^ne. Ces dispositifs sont pr§fer6s car 

20 la durete de mat6rlaux comma I'agate ou le tungst^ne facillte 
significativement I'obtention des micro-particules de la taille sp^cifiee ci- 
dessus. Pour cette raison, on ne choisira pas pref6rentiellement, voire 
on §vitera. un recours d un dispositif de broyage d billes de verre, qui 
s'est r§v6l^ beaucoup moins efflcace. 

2S Le s^chage ou la classification de I'echantillon de sol peut-Stre 

realis6e par toute m6thode connue de I'homme du m6tier. Par exemple, 
rechantillon de sol brut peut Stre s6ch§ d temperature ambiante pendant 
une dur6e de 24 a 48 heures. 

Comme indiqu6 precedemment, le milieu tampon liquide peut 

30 consister en un milieu d'extraction de I'ADN present dans les micro- 
particules. On utilisera de manidre tout d fait pr6feree un tampon 
d'extraction design^ TENP contenant respectivement 50 mM tris, 20 mM 
EDTA, 100 mM NaCI et 1% (poids/volume) de polyvinylpolypyrrolidone, d 
pH 9,0. 
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Le proc6d6 de preparation d'une collection d'acides nucl^iques 
d partir d'un 6chantillon de so! est en outre caracteris6 en ce que l'§tape 
d'obtention de micro-particules par broyage de l'6chantillon de sol 
pr6alablement s6che ou dessique est suivie d'une §tape l-(b) 
5 d'extraction des acides nucleiques presents dans les micro-particules. 

II est constant que Textractlon des acides nucl6iques est 
acconr»pagn6e d'une co-extraction de composes et/ou de constituants du 
sol ind6slrables necessitant la purification ult§rieure des acides 
nucl6iques extraits, une telle 6tape de purification ulterieure devant dtre 
10 d la fois suffisamment selective pour pemnettre reiimination des 
composes et/ou constituants du sol indSsirables et d'un rendement 
suffisant pour entralner une perte faible en quantity de I'ADN 
prealablement extrait. 

II a ete montri selon I'invention qu'une etape de purification de 
15 I'ADN extrait des micro-particules de r§chantillon de sol r6pondant aux 
criteres de s6lectivite et de rendement d6finis ci-dessus, comprend un 
traitement de I'ADN extrait par une combinaison de deux etapes 
successives de chromatographie, respectivement une chromatographie 
sur tamis moieculaire et une chromatographie d'§change d'anions. 

20 

Selon une autre caract6ristique du proc6de ci-dessus, I'etape I- 
(b) d'extraction des acides nucl6iques est suivie d'une etape l-(c) de 
purification des acides nucleiques extraits d I'aide des deux etapes de 
chromatographie suivantes: 

25 

- passage de la solution contenant les acides nucleiques sur un 
tamis moieculaire, puis r6cup6ration des fractions d'eiution enrichies en 
acides nucleiques; 

30 - passage des fractions d'eiution enrichies en acides nucleiques 

sur un support de chromatographie d'echange d'anions, puis 
recuperation des fractions d'eiution contenant les acides nucleiques. 

La nature et i'ordre des etapes de chromatographie ci-dessus 
sont essentiels d une bonne seiectivite et un excellent rendement de 
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l'6tape de purification de I'ADN pr6alablement extrait des micro- 
particules de i'^chantillon du sol pr^alablement s^che ou dessiqu6. 

De mani6re tr^s avantageuse, le support chromatographique du 
type " tamis mol§culaire ' de I'^tape de purification d'acides nucl6iques 
5 ci-dessus conslste en un support chromatographique de type Sephacryl® 
S400 HR ou un support chromatographique de caract6ristiques 
^qulvalentes. 

De mani6re tout d fait pref§r§e, le support chromatographique 
d'echange d'anions utllls6 lors de la seconde etape de purification de 

10 I'ADN extrait est un support de type Elutip® d, ou un support 
chromatographique de caract^ristiques §quivaientes. 

En comblnant les 6tapes l-(a) d'obtention de micro-particules 
de rechantillon de sol sec, l-(b) d'extraction des acldes nuclelques 
presents dans les micro-particules et l-(c) de purification par les stapes 

15 chromatographiques d6crites ci-dessus. il a 6t§ possible selon I'invention 
d'extraire directement I'ADN du sol sans purification pr^alable des 
cellules des organismes contenus initialement dans i'§chantillon, tout en 
6vitant la co-extraction de contaminants du sol, tels que par exemple les 
acides humiques qui est observ6e avec les proc6des de I'^tat de la 

20 technique. 

Les contaminants, tels que les acides humiques affectent 
s6v6rement les analyses et les utilisations subs§quentes des acides 
nucteiques dont la purification est recherchee. 

Selon le proc6d6 ci-dessus, il est en outre possible d'acceder 
25 aux acides nucteiques contenus dans les organismes qui n'ont pas et& 
lys6s m6caniquement au cours de I'^tape l-(a) d'obtention de micro- 
particules de rechantillon de sol, dans le but d'obtenir une collection 
quasi-exhaustive de la d|versit6 g6n6tique des acides nucteiques 
presents initialement dans l'6chantillon de sol. Ainsi, les micro-particules 
30 de rechantillon de sol peuvent faire I'objel d'§tapes ult6rieures de 
traitement de lyse chimique, enzymatique ou physique, ou encore d'une 
combinaison de traitements chimiques, enzymatiques ou physiques. 

Selon un premier aspect, le proced§ de preparation d'une 
collection d'acides nucteiques k partir d'un 6chantillon de sol selon 
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I'invention, peut dtre en outre caract6rls6 en ce que I'^tape l-(a) est 
suivie des stapes suivantes: 

• traitement de la suspension de sol dans un milieu tampon 
5 liqulde par sonication; 

• extraction et recuperation des acides nucieiques. 

De manidre pr6fer6e, on aura recours, pour un traitement par 
10 sonication, d un dispositif de type d micro-pointe en titane, t^l que le 
dispositif 600 W Vibracell Ultrasonicator commercialise par la Societe 
Bioblock ou encore un sonicateur de type Cup Horn. 

De maniere tout d fait prefer^e, I'etape de sonication est 
r6alis§e d une puissance de 15 W pendant une dur§e de 7 S 10 min et 
IS comprend des cycles successifs de sonication, la sonication proprement 
dite etant realisee pendant 50% de la dur^e de chaque cycle. 

Selon un second aspect, le precede ci-dessus peut §tre en 
outre caracterise en ce que I'etape l-(a) est suivie des etapes suivantes: 

20 • traitement de la suspension de sol dans un milieu tampon 

liquide par sonication; 

• incubation de la suspension d 37X apres sonication en 
presence de lysozyme et d'achromopeptidase; 

25 

• addition de SOS avant centrifugation et precipitation des 
acides nucieiques; 

• recuperation des acides nucieiques precipites. 

30 

De preference, I'etape d'incubation en presence de lysozyme et 
d'achromopeptidase sera realisee e une concentration finale de 0,3 
mg/ml de chacune des deux enzymes, preferentiellement pendant 30 
minutes d 37'C. 
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De manifere pr6fer6e, le SDS sera utilise d une concentration 
finale de 1% et pendant un temps d'Incubatfon de 1 heure d la 
temperature de eO'C avant centrifugation et pr6clpitation. 

Selon un troisi6me aspect, le proc6d6 de preparation d'une 
5 collection d'acides nucl6iques d partir d'un 6chantillon de sol ci-dessus 
est en outre caract6rise en ce que I'^tape l-(a) est suivie des stapes 
suivantes: 

- homogen6isation de la suspension de sol avec une etape de 
10 mixage violent (vortex) suivie d'une 6tape de simple agitation; 

- congelation de la suspension homogene suivie d'une 
decongeiation ; 

- traitement par sonication de la suspension apr^s 
decongeiation; 

'5 - incubation de la suspension i ZJ'C aprfes sonication en 

presence de lysozyme et d'achromopeptidase; 

- addition de SDS avant centrifugation et precipitation des 
acides nucleiques; 

- recuperation des acides nucleiques. 

20 

De maniere pr6f6r6e. les suspensions de micro-particules de 
sol sont passees au vortex puis homogeneisees par une agitation douce 
sur un agitateur ^ rotation circulaire pendant une dur6e de deux heures 
avant d'etre congeiees d -20X. 

25 Preferentiellement, les suspensions sont d nouveau agitees 

violemment par vortex pendant 10 minutes, apres decongeiation et avant 
retape de sonication. 

II va sans dire que les acides nucleiques extraits par les modes 
de realisation du precede d'extraction directe d'acides nucleiques decrit 

30 ci-dessus sont preferentiellement purifies selon I'etape de purification 
constituee d'un premier passage sur tamis moieculaire puis un passage 
subsequent des fractions d'eiution obtenues a Tissue de la 
chromatographie sur tamis moieculaire sur un support 
chromatographique d'6change d'anions. 

35 
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2. Extraction indirecte des acides nucleioues 

Selon un second mode de realisation du proc6de de 
preparation d'une collection d'acldes nucl6iques A partir d'un 6chantillon 
5 de I'environnement, selon I'invention, ledit 6chantillon de I'environnement 
subit un premier traltement de nature d permettre la separation des 
organismes, contenus dans cet 6chantillon, des autres macro- 
constituants de l'6chantilion. 

Ce second mode de realisation du proc6d6 de preparation 
10 d'une collection d'acides nucieiques selon I'invention favorise I'obtentlon 
d'acides nucieiques de grande taille, qui sont pratiquement impossibles d 
obtenir selon le premier mode de realisation du precede selon I'invention 
decrit cl-dessus, I'etape de lyse mecanique oper6e pour I'obtentlon des 
micro-particules ayant egalement pour effet de casser physiquement les 
15 acides nucieiques de I'echantillon de sol ou des acides nucieiques 
contenus dans les organismes de I'echantillon de sol. 

L'obtention d'acides nucieiques de grande taille a ete 
recherchee par le demandeur dans le but d'isoler et de caracteriser les 
acides nucieiques comprenant, au moins partiellement, I'ensemble des 
20 sequences codantes appartenant e un meme operon capable de diriger 
la biosynthese d'un compose d'Interet industriel. 

De maniere preteree. on obtient, en mettant en oeuvre le 
second mode de realisation du precede de preparation d'une collection 
d'acides nucieiques k partir d'un echantillon de sol selon I'invention , des 
25 acides nucieiques ayant une taille superieure d 100 kb. de preference 
superieure d 200. 250 ou 300 kb. et de maniere tout e fait preferee 
d'acides nucieiques d'une taille superieure d 400, 500 ou encore 600 kb. 

Ce second mode de realisation d'un precede de preparation 
d'une collection d'acides nucieiques ^ partir d'un echantillon de 
30 I'environnement selon I'invention est constitu6 d'une combinaison de 
quatre etapes successives destinees a l'obtention des acides nucieiques 
ayant les caracteristlques decrites ci-dessus. 

Lorsque I'echantillon de I'environnement est un echantillon de 
sol, 11 a ete montre selon I'invention qu'une premiere etape d'obtentlon 
35 d'une suspension par dispersion de I'echantillon de sol en milieu liquide 
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favorisait raccessibilitd des organismes contenus dans r§chantlllon sans 
provoquerde lyse m^canique significative. des cellules. 

La premiere etape d'obtention d'une dispersion de r6chantillon 
5 de sol ci-dessus rend accessibles les organismes de I'^chantillon au 
milieu exterieur et permet 6gaiement une dissociation partielle des 
organismes de I'echantillon et des macro-constituants. Elle rend ainsi 
possible une separation ult6rieure des organismes contenus initialement 
dans Techantillon des autres constituants de ce dernier. 
10 Lorsque I'Schantillon de I'environnement provient par exemple 

de v6g6taux, d'organlsmes marins ou d'Insectes, un traitement pr^alable 
par broyage est n^cessaire afin de rendre les organismes de la 
microflora associSe accessible aux stapes ultSrieures du proc^dd. 

AinsI, le present proc6d6 comprend une etape de separation 
15 des organismes des autres constituants min§raux et/ou organiques 
obtenus pr6c6demment par une centrifugation sur un gradient de 
density. Les organismes ainsi s6par6s sont ensuite soumis S une §tape 
de lyse puis d'extraction des acldes nucieiques . 

L'etape de centrifugation sur un gradient de density a, de 
20 mani6re surprenante, pemdis de s6parer les cellules d'organlsmes des 
partlcules de sol contenues dans la suspension de rechantillon. On 
aurait en effet pu s'attendre d ce qu'une proportion des cellules soient 
entratnies avec les macro-particules au sein de la phase de gradient. En 
outre, il n'avait jamais ete d6montr6 jusqu'S present qu'une 
25 centrifugation sur gradient de densite d'un 6chantillon de sol pennettait 
de retrouver, ^ I'interface phase aqueuse/gradient, une population 
d'organlsmes representative de la diversit6 des organismes presents 
dans I'echantillon de depart, du fait que ces organismes sont de volume, 
densite et forme extrSmement variables. On pouvait raisonnablement 
30 supposer qu'ils seraient retrouves indifferemment au sein de la phase 
aqueuse, d I'interface phase aqueuse/gradient de density et 6galement 
au sein du gradient de densite lui-meme. 

Ainsi. I'homme du metier pouvait s'attendre S ce que des 
organismes presentant des densites plus faibles ou plus grandes que la 
35 densite du gradient de densite utilise (densite du gradient de densite 
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comprise entre 1,2 et 1,5 g/ml . pref6rentiellement 1,3 g/ml) ne pouvait 
etre r6cup6r6s, ce qui aurait eu pour effet d'introduire un biais dans la 
repr6sentativit6 des organismes effectivement s§par6s et, par vole de 
consequence, egalement dans la diversity des acides nucleiques 
s extraits. 

En outre, dans un mode de realisation particulier du proc6d§, 
una etape de germination des spores, en particulier d'actinomyc^tes, est 
r6alis§e, ce qui a pour effet d'accroTtre de mani^re significative la 
quantite d'ADN d'actinomyc6tes recup6r6e. 

10 La demi^re 6tape consiste en une 6tape de purification des 

acides nucleiques ainsi extraits sur un gradient de chlorure de c6sium. 

De maniSre surprenante, la purification des acides nucieiques 
sur le gradient de chlorure de c6sium permet une elimination 
substantielle, voire complete, des substances composant le gradient de 

15 densite. Cette caracteristique est detenninante en ce qui conceme 
■'utilisation ulterieure des acides nucieiques purifies car le gradient de 
densite est connu comme un puissant inhibiteur enzymatique, capable le 
cas echeant d'inhiber I'activite catalytique des en2ymes utilis6es pour 
preparer insertion des acides nucieiques extraits dans des vecteurs. 

20 Selon ce second mode de realisation, le proc6de de 

preparation d'une collection d'acides nucieiques d partir d'un echantillon 
de I'envlronnement contenant des organismes selon {'invention 
comprend la succession d'etapes suivantes: 

25 (i) obtention d'une suspension par dispersion de I'echantillon de 

I'environnement en milieu iiquide puis homogen6isation de la suspension 
obtenue par agitation douce; 

(ii) separation des organismes des autres constituants mineraux 
30 et/ou organiques de la suspension homogene obtenue d I'etape (1) par 

centrifugation sur un gradient de densite; 

(iii) lyse des microorganismes separes d I'etape (ii) et extraction 
des acides nucieiques ; 

35 
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(iv) purification des acides nucl6iques sur un gradient de 
chlorure de c§sium . 

Pr§ferentiellement, la suspension de Techantillon de sol est 
5 obtenue par dispersion de cet ecliantillon par broyage d I'aide d'un 
dispositif de type Waring Blender ou un dispositif de caract6ristiques 
equivalentes. De mani6re tout a fait prefer6e, la suspension d'echantillon 
est obtenue apres trois broyages successifs d'une dur6e d'une minute 
chacun dans un dispositif de type Waring Blender. De pr6f6rence, 
10 r^chantillon broy6 sera refroidi dans la glace entre ctiacun des broyages. 

De manidre pr6f§r6e, les organismes sont ensuite s§par§s des 
particules du sol par centrifugation sur un coussin de density du type 
" Nycodenz commercialis6 par la Socl6t6 Nycomed Pharma AS. (Oslo 
, Norv^ge). Les conditions pr6f6rees de centrifugation sont de lO.OOOg 
15 pendant 40 minutes d 4'C, avantageusement dans un rotor d godets 
mobiles du type "rotor TST 28.38" commercialise par la Society 
KONTRON. 

L'anneau d'organismes localise, apr§s centrifugation, d 
I'interpiiase de la phase superieure aqueuse et de la phase inf^rieure de 
20 Nycodenz est alors preleve et \av§ par centrifugation avant reprise du 
culot cellulaire dans un tampon appropriS. 

L'etape (Hi) de lyse des organismes s6par6s a l'6tape (ii) d6crite 
cl-dessus peut §tre rSalis^e de tpute manifere connue de I'homme du 
m6tier. 

25 Avantageusement. les cellules sont Iys6es dans une solution 

Tris 10 mM-EDTA lOOmM it pH 8.0 en presence de lysozyme et 
d'achromopeptidase. avantageusement pendant une heure d Sl'C. 

L'extraction proprement dite de I'ADN peut etre 
avantageusement r6alis6e par addition d'une solution de lauryl sarcosyl 

30 (1% du poids final de la solution) en presence de proteinase K et 
incubation de la solution finale a ST'C pendant 30 minutes. 

Les acides nucleiques extraits a l'etape (iii) sont ensuite purifies 
sur un gradient de chlorure de c6sium. Pref§rentiellement, l'6tape de 
purification des acides nucleiques sur un gradient de chlorure de c6sium 
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est r^alisde par centrifugation 35.000 tours/minute pendant 36 heures, 
par exemple sur un rotor du type Kontron 65.13. 

Selon un aspect particulier du proc6d6 de pr6paration d'une 
collection d'acides nucl6iques ^ partir d'un 6chantillon de sol contenant 
5 des organismes selon {'invention, lesdits acides nucl6iques sont 
constitu6s majoritairement, sinon exclusivement, de molecules d'ADN. 

Selon un autre aspect, les acides nucl6iques peuvent §tre 
recup6r6s apr^s inclusion des organismes, s6par6s sur un gradient de 
density, dans un bloc d'agarose et lyse, par exemple chimlque et/ou 
10 enzymatique, des organismes Indus dans le bloc d'agarose. 

Un autre objet de I'invention consiste en une collection d'acides 
nuclSiques constitu6s des acides nucl§iques obtenus d I'etape ll-(iv) du 
proc6d6 de preparation d'une collection d'acides nucl6iques selon 
IS I'invention ou encore obtenue d I'Stape (c) ou une ^tape ultSrieure du 
precede de preparation d'une collection d'acides nucieiques selon 
I'invention. 

I'invention est encore relative a un acide nucl6ique caract6ris6 
en ce qu'il est contenu dans une collection d'acides nucl6iques telle que 

20 d6finie ci-dessus. 

Seton un premier aspect, un tel acide nucl6ique constitutif d'une 
collection d'acides nucl6iques selon I'invention est caract6ris6 en ce qu'il 
comprend une sequence nucl6otidique codant au molns un op6ron, ou 
une partie d'un op^ron. 

25 De manifere tout d fait pr6f6r6e, un tel op§ron code pour la 

totalite ou une partie d'une vole m6tabolique. 

L'exemple 9 d6crit la construction d'une banque d'ADN 
genomique d partir d'une souche de Streptomyces alboniger et son 
clonage respectivement dans les cosmides navettes pOS700l et 

30 pOS700R. II a ete montre selon I'invention que dans la banque d'ADN 
r6alisee dans le vecteur integratif pOS7Q0l neuf clones contiennent des 
sequences nucl6otidiques appartenant d I'operon responsable de la vole 
de biosynth6se de la puromycine. De mSme, il a pu 6tre identifi6 au sein 
de la banque d'ADN realise^ dans le vecteur r6plicatif pOS 700R douze 
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Clones contenant des sequences nucl6otidiques de l'op6ron responsable 
de la voie de biosynthSse de la puromycine. 

En particulier, certains cosmides integratlfs et replicatlfs des 
banques r^alisees pr6sentent, apres digestion par les endonucl6ases de 
5 restriction Clal et EcoRV, un fragment d'une taille de 12 kb susceptible 
de contenir la totalit6 des sequences de l'op6ron responsable de la voie 
de biosynth6se de la puromycine. 

Ainsi, selon un autre aspect, un acide nucl6ique selon 
rinventlon contlent, au molns en partle, des sequences nucl6otldlques de 
10 I'opdron responsable de la voie de biosynthdse de la puromlcyne. 

L'exemple 2 ci-apr6s d6crit la construction d'une banque d'ADN 
selon un proced§ conforme i la pr6sente Invention dans un vecteur 
pBluescript SK partir d'un sol contaminS par du lindane. 

Les vecteurs recombinants ont 6t6 transfect6s dans des 
15 cellules (^'Escherichia coli DH10B puis les cellules transfonn6es ont 6t6 
cultiv6es dans un milieu de culture appropri§ en presence de lindane. Un 
criblage des clones de cellules transfonn§es de la banque a permis de 
montrer que, sur 10.000 clones cribl6s, 35 d'entre eux pr6sentaient un 
ph6notype de degradation du lindane ." La presence du g6ne llnA chez 
20 ces clones a pu gtre confimn6e par amplification PCR grace d des 
amorces spScifiques de ce gdne. 

AInsi, selon un autre aspect, {'Invention conceme 6galement un 
acide nucl6ique contenant une sequence nucteotidique de la vole 
m6tabolique provoquant la blod6gradation du lindane. 
25 II est done clairement d6montre, comme d6crit plus haut, qu'un 

proced6 de preparation d'une collection d'acides nucl6iques d partir d'un 
echantillon de sol contenant des organismes selon I'invention ainsi qu'un 
proc6d6 de preparation d'une collection de vecteurs recombinants 
contenant les acides nucleiques constitutifs de la collection d'acides 
30 nucl6iques precites 6tait tout d fait apte S I'isolement et S la 
caract6risation de s6quences nucl6otidiques incluses dans un op6ron. 

Une d6monstration suppl6mentaire de {'aptitude d'un proc6d6 
selon {'invention k {'identification de s6quences nucteotidiques codantes 
impllquSes dans une voie de biosynt{i6se rSgul^e sous {a fomie d'un 
35 op6ron est en outre d6crite plus loin: 11 s'agit du clonage et de la 
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caractSrisation de s^uences codant pour des poiyk6tides synthases 
impliqu6es dans la voie de biosynthese des polyk§tides, qui 
appartiennent d une famille de molecules dont certains repr6sentants 
sent d'un int6r§t th6rapeutique majeur, en particulier antibiotique. 

5 La pr6sente invention a done en outre pour objet un acide 

nud6ique constitutif d'une collection d'acides nucl6iques selon 
I'invention, caract6rise en ce qu'il comprend la totality d'une sequence 
nucl^otldique codant pour un polypeptide. 

Selon un premier aspect, un acide nucl^ique constitutif d'une 

10 collection d'acides nucl§iques selon I'invention est d'origine procaryote. 

Selon un second aspect, un acide nuclSique constitutif d'une 
collection d'acides nuclSiques selon {'invention provient d'une bact6rie ou 
d'un virus. 

Selon un troisi^me aspect, un acide nucl§ique constitutif d'une 
15 collection d'acides nucl6iques selon I'invention est d'origine eucaryote. 

En particulier, un tel acide nucl6ique est caract6ris6 en ce qu'il 
provient d'un champignon, d'une levure, d'une plante ou d'un animal. 

CARACTERISATION MOLECULAIRE DE LA COLLECTION D'ACrPES 
20 NUCLEIQUES EXTRAITS DU SOL. 

Afin de sumionter les nombreux inconv^nients techniques des 
methodes de caracterisation des banques d'ADN extraits et purifies d 
partir d'un echantillon de I'environnement qui ont 6te dScrits dans la 

25 partie de la description relative d I'^tat de la technique, le demandeur a 
mis au point un proc6d6 simple et fiable permettant de caract6riser 
qualitativement et semi-quantilativement les acides nucl6iques obtenus i 
I'issue du proced6 decrit ci-dessus. 

Le proc6d6 selon I'invention consiste ainsi d amplifier 

30 universellement un fragment de 700 pb localise d I'interieur d'une 
s6quence d'ADN ribosomal de type 16 S, puis d'hybrider I'ADN amplifi6 
avec une sonde oligonucl6otidique de specificit6 variable et enfin de 
comparer I'intensitS d'hybridation de l'6chantillon par rapport d une 
gamme 6talon exteme d'ADN de sequence ou d'origine connue. 
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L'amplification pr^alable d I'hybridation avec la sonde 
oligonucleotidique permet de quantifier des genres ou des espdces de 
micro-organismes peu abondants. De plus, ('amplification par des 
amorces universelles pemiet, lors de I'hybridation, d'utlliser una large 
5 s6rie de sondes oligonucl6otidiques. 

Ainsi, I'invention a en outre pour objet un proc6de de 
d§tennination de la diversite des acides nucl6iques contenus dans une 
collection d'acides nucl6iques, et tout partlcullerement d'une collection 
d'acides nuclSiques provenant d'un 6chantillon de I'environnement, 
10 pref^rentiellement d'un Schantillon du sol, ledit precede comprenant les 
stapes suivantes: 

- miss en contact des acides nuclSiques de la collection 
d'acides nucl§iques d tester avec un couple d'amorces 

15 oligonucl^otidiques hybridant d toute sequence d'ADN ribosomal 16 S 
bact^rien; 

- realisation d'au moins trois cycles d'amplification ; 

- detection des acides nucl6iques amplifies d I'aide d'une sonde 
oligonucleotidique ou d'une plurality de sondes oligonucl6otidiques, 

20 chaque sonde hybridant sp^cifiquement avec une sequence d'ADN 
ribosomal 16 S commune d un rSgne, un ordre, une sous-classe ou un 
genre bacterien; 

- le cas echSant, comparaison des r^suitats de r§tape de 
detection precedents avec les resultats de detection, d i'aide de la sonde 

25 ou de la pluralite de sondes d'acides nucieiques de sequence connue 
constituent une gamme etalon. 

De maniere pr6f6ree, un premier couple d'amorces hybridant 
avec des regions universellement conservees du g6ne de I'ARN 
ribosomal 16 S est constitue respectlvement des amorces FGPS 612 
30 (SEQ ID N''12) et FGPS 669 (SEQ ID N'lS). 

Un second mode de realisation d'un couple d'amorces pr6fere 
selon I'invention est constitue du couple d'amorces universelles 63 f 
(SEQ ID N-aa) et 1387r (SEQ ID N'23). 

Selon un mode particulier de realisation d'un precede de 
35 detennination de la diversite des acides nucieiques d'une collection 
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d'acides nucl§iques. r§tape d'amplification d I'aide d'un couple 
d'amorces universelles peut Stre rdalisSe sur une collection de vecteurs 
recombinants dans chacun desquels a ^t§ ins6r6 un acide nucl^ique de 
la collection d'acides nucl^iques considerSe, pr§alablement d I'etape 
s d'hybridation avec les sondes ollgonucl6otldiques sp^cifiques d'un 
r^gne, d'un ordre, d'une sous-classe ou d'un genre bacterien partlculier. 

Un tel proc6d6 de detemnination de la diversity des acldes 
nucl^iques contenus dans une collection est tout particulierement 
applicable aux collections d'acides nucl^iques obtenus confomidment d 

10 I'enseignement de la pr^sente description. 

Ainsi, I'exemple 3 dStaille un proc6d6 de preparation d'une 
collection d'acides nucl6iques d partir d'un dchantillon de sol contenant 
des organismes comprenant une 6tape d'extraction indirecte d'ADN par 
dispersion d'un ^chantillon du sol prSalablement d la separation des 

15 cellules sur gradient de Nycodenz. lyse des cellules puis purification de 
I'ADN sur gradient de chlorure de cesium. 

La collection d'acides nucl6iques ainsi obtenue a 6t§ utilis6e 
telle quelle ou sous la fomie d'Inserts dans des vecteurs de type 
cosmide dans un precede d'amplification d I'aide des amorces 

20 universelles de I'ADNr 16 S precit6es, puis les ADN amplifies ont ete 
soumis d une etape de detection e I'aide de sondes oligonucieotidiques 
de sequences SEQ ID N'U d SEQ ID N''21 qui sont presentees dans le 
tableau 4. 

Les resultats montrent qu'un precede de preparation d'une 
2S collection d'acides nucieiques e partir d'un echantillon de sol contenant 
des organismes selon I'invention permet d'acceder e I'ADN de plus de 
14% de la microflore tellurique totale, soit 2x10* cellules par gramme de 
sol. alors que la microflore totale cultivable ne repr6sente qu'd peine 2% 
de la population microbienne totale. 
30 Afin de d6tenniner la diversite phylogenetique d'une collection 

d'acides nucl6iques prepares conform6ment d I'invention, 47 sequences 
du gene ARNr 16S ont ete isoiees et sequencees. Ces sequences 
conrespondent respectivement aux sequences nucieotidiques SEQ ID 
N°60 d SEQ ID N'lOe. 
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Les acides nuclSiques comprenant ies sequences SEQ ID N** 
60 d SEQ ID N" 106 font 6galement partie de I'invention, ainsi que les 
acides nucl6iques poss6dant au molns 99 %, pr6f6rentiellement 99,5% 
ou 99,8% d'identit6 en acides nucleiques avec les acides nucl6iques 
5 comprenant les sequences SEQ ID N" 60 a SEQ ID N" 106. De telles 
sequences peuvent etre utilis6es notamment en tant que sondes pour 
cribiler des clones d'une banque d'ADN et identifier ainsi ceux , parmi les 
clones de la banque, qui contiennent de telles sequences, ces 
sequences 6tant suceptlbles d'&tre d proximity de sequences codantes 
10 d'lntSrSt, telles que des sequences codant pour des enzymes impliqu6es 
dans la vole de biosynthdse de metabolites antiblotiques, par exemple 
des polyk^tides. 

La comparaison des sequences d'ARNr 168 d partir d'une 
banque d'ADN r§alis§e conformSment d I'invention avec les sequences 

15 r6pertori6es dans la base donnees RDP (Maidak B.L., Cole J.R., Parker 
C.T., Garrity G.M., Larsen N., Li B.. Lilburn T.G., McCaughey, MJ., 
Olsen G.J.. Overbeek R., Pramanik S., Schmidt T.M., Tiedje J.M., 
Woese C.R. (1999) "A new projet of the RDP (Ribosomal Database 
Project)" Nucleic Acids Research Vol. 27: 171-173) ont permis de 

20 determiner que les acides nucleiques contenus dans une collection 
d'acides nucieiques selon I'invention proviennent d'a-proteobacteries, de 
p-proteobact6rles, de 8-prot6obacterles, de y-prot§obact6ries, 
d'actinomycetes ainsi que d'un genre apparent^ d acidobact6rium. Ces 
resultats, pr6sent§s dans le tableau 7 ainsi que par I'arbre 

25 phylogenetique de la figure 7 rendent compte de la grande diversit6 
phylog6n6tique des acides nucl6lques contenus dans une banque 
d'ADN prSparee confomi6ment au proc6d6 selon I'invention. 

VECTEURS DE CLONAGE ET/OU D'EXPRESSION 

30 

Chacun des acides nuc!6iques contenus dans une collection 
d'acides nucl6iques prepares confomi6ment d I'invention peut etre 
insure dans un vecteur de clonage et/ou d'expression. 

A cette fin. tous types de vecteurs connus de I'etat de la 
35 technique peuvent etre utilises, tels que des vecteurs viraux , des 
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phages, des plasmides, des phagemides, des cosmides, des 
phosmides, des vecteurs de type BAG, des bacteriophages P1 . des 
vecteui^ de type BAG, des vecteurs de type YAG, des plasmides de 
levure ou encore tout autre vecteur connu de I'^tat de la technique par 
5 rhomme du metier. 

On aura avantageusement recours selon I'invention d des 
vecteurs permettant une expression stable des acides nijcl^iques d'une 
banque d'ADN. A cette fin, de tels vecteurs incluent pr6ferentiellement 
des sequences de regulation de la transcription qui sont tocalis^es en 

10 phase (" operably linked ") avec I'insert g^nomique de mani^re d 
pemiettre rinitiation et/ou la regulation de I'expression d'au moins une 
partie dudit insert d'ADN. 

II rSsulte de ce qui precede, que {'invention conceme encore un 
precede de preparation d'une collection de vecteurs recombinants 

is caracterise en ce que les acides nucieiques obtenus d I'etape ll-(iv) ou d 
retape l-(c) ou toute autre etape ult6rieure d'un precede de preparation 
d'une collection d'acides nucieiques k partir d'un echantillon de sol 
contenant des organismes selon I'invention sont inseres dans un vecteur 
de clonage et/ou d'expression. 

20 Prealablement a leur insertion dans un vecteur de clonage 

et/ou d'expression, les acides nucieiques constitutifs d'une collection 
d'acides nucieiques selon {'invention peuvent §tre separes en fonction de 
leur taille, par exemple par eiectrophorese sur un gel d'agarose, le cas 
echeant apres digestion d I'aide d'une endonuciease de restriction. 

25 Selon un autre aspect, la taille moyenne des acides nucieiques 

constitutifs d'une collection d'acides nucieiques selon {'invention peut 
etre rendue d'une taille sensiblement unifomrie par la mise en oeuvre 
d'une etape de rupture physique pr6alablement d leur insertion dans le 
vecteur de clonage et/ou d'expression. 

30 Une telle etape de mpture physique ou mecanique des acides 

nucieiques peut consister en des passages successifs de ces derniers, 
en solution, dans un canal metaKique d'environ 0,4 mm de diametre, par 
exemple le cana{ d'une aiguille de serihgue ayant un tel diametre. 

La tai((e moyenne des acides nuc{eiques peut dans ce cas etre 

35 comprise entre 30 et 40 kb de {ongueur. 
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La construction des vecteurs pref6res selon I'invention est 
shematis6e dans les figures 25 (cosmide int6grarif conjugatif) et 26 (BAG 
integratif ). 

Des vecteurs de clonage et/ou d'expression pouvant Stre 
s avantageusement utilises aux fins d'insertion des acides nucl^iques 
contenus dans une collection ou banque d'ADN selon I'invention sont 
notamment les vecteurs d6crits dans ie brevet europ6en N°EP-0 350 
341 et dans Ie brevet US N°5 688 689, de tels vecteurs 6tant 
sp§clalement adapt6s d la transformation de souches d'actinomycdtes. 
10 De tels vecteurs contiennent, outre une sequence d'ADN de I'insert, une 
sequence d'attachement art ainsi qu'une sequence d'ADN codant pour 
une int§grase (sequence jnt) fonctionnelle dans les souches 
d'actinomycStes. 

Toutefois, il a 6t6 obsen/e selon I'invention que certains 
15 vecteurs de clonage et/ou d'expression pr6sentaient des inconv6nlents 
et que leur capacity fonctionnelle thSorique n'§tait pas atteinte dans la 
pratique. 

AinsI, 11 est apparu que Ie syst6me d'int6gration contenu dans 
des vecteurs de l'6tat de la technique, et notamment dans les vecteurs 
20 d6crits dans Ie brevet europ6en n^EP 0 350 41 ne pemettalt pas en 
r^alit^ une bonne integration de I'insert d'ADN de la banque au sein du 
chromosome bacterien. 

Partant de I'hypothSse que les deficits fonctionnels d'integration 
25 de tels vecteurs au sein du chromosome bacterien 6taient dus ^ un 
d6faut dans I'expression du gdne de I'int6grase present dans ces 
vecteurs, Ie demandeur a tout d'abord cherch6 d augmenter I'expression 
du g§ne de I'int^grase en substituant au promoteur de la transcription 
initial un promoteur de la transcription susceptible d'augmenter 
30 signiflcativement Ie nombre de transcrits de I'int6grase, 

Les r6sultats ont 6te decevants et la fonction d'integration au 
chromosome de ces vecteurs n'a pas 6t6 am6lior§e. 

De mani6re surprenante, il a §t6 montre selon I'invention que 
les difficult6s d'expression de I'lnt^grase contenues dans cette famille de 



wo 01/40497 



36 



PCT/FROO/03311 



vecteurs integratifs ne se situait pas au niveau de la quantity 
d'expression des transcrits, mais au niveau de leur stability. 

Seion une seconde hypoth^se, le demandeur a pu montrer que 
le d§faut de stability des transcrits de i'intSgrase 6tait caus6 par des 
s deficits dans la tenninaison de la transcription de i'ARN messager 
correspondent. 

Le demandeur a alors insure un site terminateur place en aval 
de la sequence codant pour I'integrase du vecteur de manidre d obtenir 
un ARM messager de taille d^terminSe. L'insertlon d'un signal de 
10 tenninaison additionnel en aval de la sequence nuci6otidique codant 
pour I'integrase du vecteur a pennis I'obtention d'une famille de vecteurs 
integratifs de type cosmide et de type BAG . 

Pr6f6rentlellement, le site terminateur est plac6 en aval du site 
d'attachement att. 

15 

En outre, le demandeur a mis au point de nouveaux vecteurs 
conjugatifs et de nouveaux vecteurs r^plicatlfs du type cosmide et de 
nouveaux vecteurs conjugatifs de type BAC qui peuvent 
avantageusement Stre utilises pour l'insertlon des acides nucliiques 

20 constitutife d'une collection d'acides nucl^iques pr6par6s selon le 
proc6d6 de I'invention. 

Lorsque l'insertlon de fragments d'ADN de taille moyenne est 
recherchee, on utilise pr^fSrentiellement des vecteurs du type cosmide, 
capables de recevoir des inserts ayant une taille maximale d'environ 50 

25 kb. 

De tels vecteurs cosmidiques sent tout particuli^rement adapt§s 
pour {'insertion d'acides nucl§iques constitutifs d'une collection d'acides 
nucleiques obtenus selon le proced6 de I'invention comprenant une 
premiere 6tape d'extraction direcle d'ADN par lyse m6canique des 

30 organismes contenus dans r6chantillon de sol initial. 

Lorsque l'insertlon d'acides nucleiques de grande taille, en 
particulier d'acides nucl6iques d'une taille superieure a 100 kb, voire 
sup^rieure d 200, 300, 400, 500 ou 600 kb est recherchee, on aura alors 
recours pref6rentiellement d des vecteurs du type BAC capables de 

35 recevoir des inserts d'ADN d'une telle taille. 
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De tels vecteurs de type BAC sont tout particuli^rement 
adaptds pour I'insertion des acides nucl6iques const'tutife d'une. 
collection d'acides nucl^lques obtenus conform^ment au proc^§ salon 
I'invention dans lequel la premiere §tape est constitute d'une extraction 
5 indirecte de I'ADN par separation prealable des organismes contenus 
dans rtchantillon de sol Initial et elimination des macro-constituants 
dudit ^chantillon de sol. 

En particulier, des vecteurs du type BAC sont avantageusement 
mis en oeuvre pour rinsertion d'acides nucltiques de grande taille 
10 contenant, au molns partlellement, la sequence nuclSotidique d'un 
optron. 

Ainsi, le proctdd de preparation d'une collection de vecteurs 
recombinants de clonage et/ou d'expression selon I'invention est en 
outre caracterise en ce que le vecteur de clonage et/ou d'expression est 
15 du type plasmide. 

Selon un autre aspect, un tel proc6de est caracttrise en ce que 
le vecteur de clonage et/ou d'expression est du type cosmide. 

Selon un premier aspect, 11 peut s'agir d'un cosmide r§plicatif 
Chez E.coli et int§gratif chez Streptomyces. Un vecteur cosmidique tout d 
20 fait prefer^ rtpondant d une telle definition est le cosmide pOS700l 
decrit d I'exemple 3. 

Selon encore un autre aspect, le vecteur cosmidique est 
conjugatif et integratif chez Streptomyces. 

De maniere generate, des vecteurs conjugatife de type cosmide 
25 ou de type BAC, qui comprennent dans leurs sequences nucieotidiques 
un motif reconnu par la machinerie enzymatique cellulaire appeie 
" origine de conjugaison " sont utilises chaque fois que Ton veut eviter un 
recours ^ des techniques de transfomriation lourdes et peu 
automatisables. 

30 Par exemple, la transfection de vecteurs initialement heberges 

par des cellules de E.coli dans des cellules de Streptomyces necessite 
classiquement une etape de recuperation du vecteur recombinant 
contenu dans les cellules de Escherichia coli, et sa purification prealable 
e retape de transfonmation de protoplastes de Streptomyces. il est 

35 communement admis qu'une transfection d'un ensemble de 1000 clones 
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de Escherichia coli dans Streptomyces requiert I'obtention d'environ 
8000 clones pour que chaque clone de E. coli ait une chance d'etre 
repr6sent§. 

A I'inverse, une etape de transfectlon par conjugaison d'un 
5 vecteur heberg6 par E.coli vers des cellules de Streptomyces n6cessite 
le meme nombre de clones de chacun des micro-organlsmes, r6tape de 
conjugaison ayant lieu " clone d clone " et ne comprenant en outre pas 
les difficult6s techniques Ii6es d I'etape de transfert de materiel 
g6n6tique par transformation de protoplastes, par exemple en presence 
10 de polyethylene glycol. 

Afin d'optlmiser la construction de banque d'ADN chez 
Streptomyces, il a et§ mis au point selon invention, de nouveaux 
vecteurs conjugatlfe de type cosmide et de type BAG de nature d 
permettre une efficacite maximale de I'etape de conjugaison. 
IS Notamment, les nouveaux vecteurs conjugatifs selon I'invention 

ont ete construits en plagant un gdne marqueur de selection e I'extremite 
de I'ADN du vecteur qui est transfere ^ la bacterie receptrice en dernier 
lieu.Ce perfectionnement aux vecteurs conjugatifs de I'etat de la 
technique permet de ne selectionner positivement que les bacteries 
20 receptrices ayant re9u la totalite de I'ADN du vecteur et, en 
consequence, la totalite de I'ADN de I'insert d'interet. 

Des cosmides conjugatife et integratifs chez Streptomyces 
preteres selon I'invention sont les cosmides pOSV303, pOSV306 et 
pOSV307 decrits i I'exemple 5. 
25 Selon un autre aspect, un procede de preparation d'une 

collection de vecteurs recombinants selon I'invention est mis en oeuvre d 
I'aide d'un cosmide replicatif d la fois chez E.coli et chez Streptomyces. 
Un tel cosmide est avantageusement le cosmide pOS 700R d6crit e 
I'exemple 6. 

30 Selon encore un autre aspect, le precede ci-dessus peut etre 

mis en oeuvre avec un cosmide replicatif chez E. coli et Streptomyces et 
conjugatif chez Streptomyces. 

Un tel cosmide replicatif et conjugatif peut etre obtenu e partir 
d'un cosmide replicatif conforme ^ I'invention, par I'insertion d'une 
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origine de transfer! appropriee, telle que RK2, comme d6crlt § I'exemple 
6 pour la construction du vecteur pOSV303. 

Selon un autre mode de realisation avantageux du proc§d§ de 
preparation d'une collection de vecteurs recombinants selon I'invention, 
5 on a recours ^ un vecteur de clonage et/ou d'expression de type BAG. 

Selon un premier aspect, le vecteur du type BAG est int6gratif 
et conjugatif chez Streptomyces. 

De maniere tout d fait pref6r6e, un tel vecteur BAG intdgratif et 
conjugatif chez Streptomyces est le vecteur BAG pOSV 403 d6crit ^ 
ID I'exemple 8, ou encore ies vecteurs BAG pMBD-1, pMBD-2, pMBD-3, 
pMBD-4, pMBD-5 et pMBD-6 d6crlts d Texemple 15. 

L'invention a en outre pour objet un vecteur recombinant 
caracterise en ce qu'il est choisi pannl Ies vecteurs recombinants 
suivants: 

15 a) un vecteur comprenant un acide nucteique constitutif d'une 

collection d'acides nucleiques selon l'invention; 

b) un vecteur tel qu'obtenu selon un precede 6liminant tout 

recours ^ Taction d'une endonucl6ase de restriction sur le fragment 

d'ADN a insurer, tel que d^crit pr^cedemment. 
20 Oe maniere tout d fait prSferee, l'invention est egalement 

relative a un vecteur choisi parmi Ies vecteurs suivants: 

- le cosmide pOS700l; 

- le cosmide pOSV303; 
25 - le cosmide pOSV306; 

- le cosmide pOSV307; 

- le cosmide pOS700R; 

- le vecteur BAG pOSV403; 

- le vecteur BAG pMBD-1; 
30 - le vecteur BAG pMBD-2; 

- le vecteur BAG pMBD-3; 

- le vecteur BAG pMBD-4; 

- le vecteur BAG pMBO-S; 

- le vecteur BAG pMBD-6. 



wo 01/40497 



40 



PCTAFROO/03311 



L'invention est en outre relative d une collection de vecteurs 
recombinants tels qu'obtenus selon I'un quelconque des proc^d^s selon 
l'invention. 

5 Proced6 de preparation d'un vecteur recombinant de clonaqe et/ou 
d'expression selon l'invention. 

Les techniques conventionnelles d'insertion d'ADN au sein d'un 
vecteur afin de preparer un vecteur de clonage et/ou d'expression 

10 recombinant font ciassiquement appel d une premiere 6tape au cours de 
laquelle une endonucl^ase de restriction est incub§e d la fois avec I'ADN 
d insurer et avec le vecteur r^cepteur errant ainsi des extremitSs 
compatibles entre I'ADN d insurer et I'ADN du vecteur permettant 
I'assemblage des deux ADN avant une 6tape de ligation finale 

1 5 permettant I'obtention du vecteur recombinant. 

Toutefois, une telle technique conventionnelle presente des 
inconv6nients notables, tout particuli6rement lorsque est recherch§e 
('insertion d'acides nucl^iques de grande taille dans un vecteur de 
clonage et/ou d'expression. 

20 En effet, I'actlon prealable d'une enzyme de restriction sur les 

fragments d'ADN destines d etre insures dans un vecteur est susceptible 
de r^duire notablement la taille de cet ADN pr^alablement d son 
Insertion dans le vecteur. II va sans dire qu'une reduction significative de 
la taille de I'ADN prSalablement d son insertion sur un vecteur est une 

25 situation particuli§rement d^favorable lorsqu'est recherche le clonage de 
fragments d'ADN de grande taille susceptible de contenir I'ensemble des 
sequences codantes et, le cas ^ch^ant, Sgalement des sequences 
r^gulatrices, d'un op§ron dont I'expression constitue une vole de 
biosynthese complete d'un metabolite d'int6r§t industriel, et tout 

30 particuli§rement d'un compos6 d'inter§t th6rapeutique. 

Pour rem6dier aux inconv§nients des techniques de I'art 
ant6rieur, il a 6te mis au point selon l'invention deux precedes de 
preparation d'un vecteur recombinant de clonage et/ou d'expression qui 
ne n^ssitent pas le recours d une endonuclease de restriction sur 

35 I'ADN d ins6rer prealablement d son introduction au sein du vecteur. De 
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tels precedes sont en consequence tout d fait adapt^s au clonage de 
longs fragments d'ADN susceptibles de contenir, au moins partiellement, 
I'ensemble des sequences codantes et, le cas 6ch6ant, 6galement des 
sequences r6gulatrices, d'un operon complet responsable d'une voie de 
5 biosynth&se. 

Selon un premier aspect, un proc6d6 de preparation d'un 
vecteur recombinant de clonage et/ou d'expression selon I'invention est 
caracteris6 en ce que insertion d'un acide nucl^ique dans le vecteur de 
clonage et/ou d'expression, comprend les Stapes suivantes: 

10 

- ouvrir le vecteur de clonage et/ou d'expression d un site de 
clonage choisi, d I'aide d'une endonuclSase de restriction appropride; 

- ajouter un premier acide nucl6lque homopolym6rique d 
15 rextr6mit6 3' libre du vecteur ouvert; 

- ajouter un second acide nucl6ique homopolym6rique, de 
sequence compl6mentaire au premier acide nucl6ique 
homopolymerique, a I'extr6mit6 3' libre de I'acide nucl6ique d insurer 

20 dans le vecteur; 

- assembler I'acide nuclSique du vecteur et I'acide nuclSique par 
hybridation du premier et du second acide nuclSique homopolymerique 
de sequences compiementaires I'une de I'autre; 

25 

- refermer le vecteur par ligation. 

Un tel precede est decrit aux exemples 10 et 13 ci-apr6s. 
De maniere avantageuse, le precede ci-dessus peut comporter 
30 les caracterlstiques suivantes, isolement ou en combinaison: 



- le premier acide nucieique homopolymerique est de sequence 
poly(A) ou poly(T); 
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- le second acide nucl§ique homopolymerique est de sequence 
poly(T) ou poly(A). 

De mani^re tout ci fait prefSrSe, les acides nucl^iques 
5 homopolymeriques ont une longueur comprise entre 25 et 100 bases 
nucI6otidiques, pr6f6rentiellement entre 25 et 70 bases nucI6otidiques. 

Le proc6d6 de preparation d'un vecteur recombinant de 
cionage et/ou d'expression decrit ci-dessus est particuliSrement adapts d 
la construction de banques d'ADN dans des vecteurs de type BAG. 
10 Ainsi, selon un mode de realisation avantageux du proc§d§ de 
preparation d'un vecteur recombinant decrit ci-dessus, ledit proc6d6 est 
en outre caracteris6 en ce que la taille de I'acide nucieique ^ insurer est 
d'au moins 100 kb, et preferentiellement d'au moins 200, 300, 400, 500 
ou 600 kb. 

IS Un tel precede de preparation est done particulierement adapte 

a I'insertion des acides nucieiques contenus dans une collection d'acldes 

nucieiques obtenus selon le precede de I'lnventlon. 

Afin de permettre I'insertion de fragments d'ADN de grande 

taille dans des vecteurs de cionage et/ou d'expression, il a ete mis au 
20 point selon I'lnventlon, un second precede ayant pennis d'eiiminer tout 

recours d Taction d'une endonuciease de restriction sur I'ADN destine d 

etre insere au sein du vecteur. 

Un tel precede de preparation d'un vecteur recombinant de 

cionage et/ou d'expression selon I'invention est caracterise en ce que 
25 retape d'insertion d'un acide nucieique dans led'rt vecteur de cionage 

et/ou d'expression comprend les etapes suivantes: 

- creation de bouts francs sur les extremites de I'acide 
nucieique de la collection par elimination des sequences 3' sortantes et 

30 remplissage des sequences 5' sortantes; 

- ouverture du vecteur de cionage et/ou d'expression d un site 
de cionage choisi d I'aide d'une endonuciease de restriction appropriee; 



35 



adition d'adaptateurs oligonucieotidiques compiementaires ; 
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- creation de bouts francs aux extr^mitSs de I'acide nuclSique 
du vecteur par Elimination des sequences 3' sortantes et remplissage 
des sequences 5' sortantes, puis ddphosphorylation des extrSmitSs 5' 

5 afin de prSvenir une recircularisation du vecteur; 

- insertion de I'acide nuclSique de la collection dans le vecteur 
par ligation. 

10 De mani^re pr^fer^e, I'elimination des sequences 3' sortantes 

est r^alisEe d I'aide d'une exonuclEase, telle que I'enzyme de Klenow. 

De manidre prdfdr^e, le remplissage des sequences 5' 
sortantes est r^alisd d I'aide d'une polymerase, et de mani§re tout a fait 
pr6f§r6e de la T4 polymerase, en presence des quatre nucleotides 
15 triphosphates. 

Un proc6de de preparation d'un vecteur recombinant de 
clonage et/ou d'expression par elimination des sequences 3' sortantes et 
remplissage des sequences 5' sortantes tel que decrit ci-dessus est 
partlculierement adapte a la construction de banques d'ADN d partir de 
20 vecteurs de type cosmide. 

Un tel precede d'obtention de vecteurs recombinants est decrit 
d I'exemple 12. 

Dans un mode particulier de preparation d'un vecteur 
recombinant selon I'invention, des oligonucleotides comprenant un ou 
25 plusieurs sites de restriction rares sont ajoutes sur le vecteur au niveau 
du site de clonage de i'ADN d inserer, confonnement d I'enselgnement 
de I'exemple 10. Cet ajout d'oligonucieotides facilite la recuperation 
ulterieure des inserts sans clivage de ces demiers. 

30 CELLULES HOTES 

Bien que tout type de cellules hdtes puisse etre utilise pour la 
transfection ou la transfonnation avec un acide nucieique ou un vecteur 
recombinant selon I'invention, notamment une cellule bote procaryote ou 
35 eucaryote, on utilisera de preference des cellules hdtes dont les 
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caracteres physiologiques, biochimiques et g^n^tiques sont bien 
caracteris6s, facilement cultivables ^ grande Schelle et dont les 
conditions de culture pour la production de metabolites soient bien 
connues. 

5 De mani^re pr6f6rentielle, la cellule hote receptrlce d'un acide 

nucl6lque ou d'un vecteur recombinant selon {'invention est 
phylogenetiquement proche des organismes donneurs contenus 
initialement dans I'echantillon de I'environnement desquels les acides 
nucieiques sont originaires. 
10 Oe mani^re tout ^ fait pr^f^ree, una cellule hdte selon 

I'invention doit possdder un usage des codons similaire, ou du moins 
proche, des organismes donneurs presents initialement dans 
r6chantillon de I'environnement, tout particuli6rement de I'echantillon de 
sol. 

IS La taille des fragments d'ADN susceptible de porter les 

sequences nucleotidiques d'int6r§t recherchees peut §tre variable. Ainsi, 
des enzymes cod6es par des genes de taille moyenne de 1 kb pourront 
etre exprim6es ^ partir d'inserts de petite taille alors que I'expression de 
metabolites secondaires n6cessiteront le maintien dans I'organisme h6te 

20 de fragments de taille bien supSrieure, par exemple de 40 kb k plus de 
100 kb. 200 kb. 300 kb, 400 kb ou 600 kb. 

Ainsi, les cellules hdtes de Escherichia coli constituent un choix 
privilegie pour le clonage de grands fragments d'ADN. 

De maniere tout d fait pref§ree, on aura recours d I'utilisation de 

2S la souche de Escherichia coli designee DH10B et decrite par Shizuya et 
al; (1992) pour laquelle des protocoles de clonage dans des vecteurs 
BAG ont ete optimises. 

Toutefols, d'autres souches de Escherichia coli peuvent etre 
avantageusement utillsees pour la construction d'une banque d'ADN 

30 selon I'invention, telles que les souches E.coli Sure, E.coli DH5 a, ou 
encore E.coli 294 (ATCC N'31446). 

En outre, la construction d'une banque d'ADN par transfection 
de cellules de E.coli avec des vecteurs recombinants selon I'invention 
est egalement possible, I'expression de genes de divers procaryotes tels 
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que Bacillus, Thermotoga. Corynebacterium, Lactobacillus ou 
Clostridium ayant d§crite dans la demande PCT N'WO 99/20799. 

De mani^re g6n6rale, des cellules hotes de E.coli peuvent dans 
5 tous les cas constituer des hdtes transitoires dans lesquels des vecteurs 
recombinants selon I'invention pourront etre malntenus avec une grande 
efficaclt^, le materiel gdndtique pouvant etre facllenrtent manlpul§ et 
archive et fagon stable. 

Dans le but d'exprimer la plus grande diversite mol§culaire 
10 possible, d'autres hdtes cellulaires pourront 6tre §galement 
avantageusement mis en oeuvre tels que des cellules de Bacillus. 
Pseudomonas, Streptomyces, Myxococcus, Aspergillus nidulans ou 
encore Neurospora crassa. 

II a en outre montr^ selon la pr^sente invention, que des 
IS cellules de Streptomyces lividans peuvent §tre utllis§es avec succ^s et 
constituent des syst^mes d'expression compl^mentaires d Escherichia 
coli. 

Streptomyces lividans constitue un module pour I'etude de la g§n§tique 
des Streptomyces et a ^galement 6t6 utilis§ comme hote d'expression 

20 heterologue de nombreux metabolites secondaires. Streptomyces 
lividans. possSde en commun avec d'autres actinomycStes tels que 
Streptomyces coelicolor, Streptomyces griseus, Streptomyces fradiae, 
ainsi que Streptomyces griseochromogenes, /es molecules pr^curseurs 
et les systdmes de regulation n^cessaires d I'expression de tout ou 

2S partie des voies de biosynthSses complexes, telles que par exemple la 
voie de biosynthdse des polykStides ou encore la vole de biosynth^se 
des polypeptides non ribosomlques reprSsentant des classes de 
molecules de structures trds diverses. 

Streptomyces lividans presente §galement I'avantage 

30 d'accepter I'ADN etranger avec des efficacit§s de transformation 
eievSes. 

Ainsi, I'invention concerne aussi une cellule hdte recombinante 
comprenant un acide nucl^ique selon I'invention. constitutif d'une 
collection d'addes nucl^iques pr^parSe selon un proc^dd confomfie d 
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I'invention, ou encore une cellule hdte recombinante comprenant un 
vecteur recombinant tel que d^fini pr6c6demment. 

Selon un premier aspect, II peut s'aglr d'une cellule hdte 
recombinante d'origine procaryote ou eucaryote. 
5 Avantageusement, une cellule recombinante selon I'invention 

est une bacterie, et de maniere tout k fait pr§f6ree une bact6rie choisie 
parmi E.co// et Streptomyces. 

Selon un autre aspect, une cellule hdte riscombinante selon 
I'invention est caracterisee en ce qu'il s'agit d'une levure ou encore d'un 

10 champignon filamenteux. 

L'invention a Sgalement trait d une collection de cellules hdtes 
recombinantes, chacune des cellules hdtes constitutive de la collection 
comprenant un acide nucl6ique provenant d'une collection d'acides 
nucl^iques rSalisSe conformement i un procSd^ de preparation d'une 

15 collection d'acides nucl^iques d partir d'un echantillon de sol contenant 
des organismes tel que d^crit ci-dessus. 

L'invention est 6galement relative d une collection de cellules 
hotes recombinantes, chacune des cellules hdtes constitutives de la 
collection comprenant un vecteur recombinant selon l'invention. 

20 En raison de la grande taille des inserts il est necessaire d'avoir 

une efficacit§ maximale de transfomriation. Dans ce but, une souche 
rSceptrice de Streptomyces lividans exprimant I'int^grase de pSAM2 de 
fagon constitutive afin de favoriser l'int6gration site-sp6cifique du vecteur 
est pr6f6r6e. Pour cela, le gene int sous contrdle d'un promoteur fort est 

25 intdgrS dans le chromosome. La surproduction d'int^grase n'induit pas 
de ph§nomenes d'excision (Raynal et a!., 1998). 

La production d'un nouveau metabolite d partir de I'insert 
pourrait itre toxique pour Streptomyces si I'insert ne contient pas de 
genes de resistance d I'antibiotique produit ou si ce g§ne est peu ou pas 

30 exprime. La capacite des diff^rents genes pennettant a Streptomyces 
ambofaciens de resister d I'antibiotique qu'il produit est 6tudi6e 
(Gourmelen et al.. 1998; Pernodet et al., 1999). Certains de ces g6nes 
cedent des transporteurs de type ABC susceptibles de conf6rer un large 
spectre de resistance. Ces genes peuvent etre introduits et surexprim6s 

35 dans la souche hdte de Streptomyces lividans. 
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A rinverse, une souche hypersensible aux antiblotiques peut 
§tre utilis6e (Pemodet et al., 1996), afin de d^tecter dans la banque la 
presence de g6nes de r6sistance. En effet, chez les micro-organismes 
producteurs d'antiblotique, ces g^nes de resistance sont souvent 
5 associ6s aux genes de la voie de biosynthdse de rantiblotique. La 
selection de clones reslstants peut pennettre d'effectuer simplement un 
premier tri avant les tests plus complexes de detection d'un nouveau 
metabolite produit par le clone. 

10 ISOLEMENT ET CARACTERISATION DE NOUVELLES SEQUENCES 
NUCLEOTIDIQUES CQDANT POUR PES POLYKETIDES 
SYNTHASES. 

Selon I'invention, une collection de cellules hdtes 
IS recombinantes a ^te obtenue apr^s transfection des cellules hdtes par 
une collection de vecteurs recombinants contenant chacun un insert 
d'acide nucl6ique provenant d'une collection d'acides nucl6iques 
prepar6e conform6ment au proced§ selon I'invention. 

Plus pr6cis§ment, les fragments d'ADN obtenus selon le 
20 proc6d§ de I'invention dans lequel il est mis en oeuvre Une 6tape 
d'extraction indirecte d'ADN des organismes contenus dans I'echantillon 
de sol ont 6t6 tout d'abord clones dans le cosmide int^gratif pOSZOOI. 

L'6tape d'insertion des fragments d'ADN dans le cosmide 
integratif pOS700l a 616 realisSe selon le proc6d6 de I'invention dans 
25 lequel des queues de polynucleotides homopolymferiques poly(A) et 
poly(T) ont 6t6 ajoutSes d I'extremite 3' respectivement de I'acide 
nucieique du vecteur et des fragments d'ADN 6 insurer. 

Les vecteurs recombinants ainsi construits ont §t6 encapsid6s 
dans des t§tes de phage lambda et les phages obtenus ont ete utilises 
30 pour infecter des cellules de E. coli selon des techniques bien connues 
de I'homme du m6tier. 

Une banque d'environ 5000 clones de Escherichia coli a 6te 

obtenue. 

Cette banque de clones a 6t6 crlbl6e avec des couples 
35 d'amorces sp6cifiques d'une sequence nucl6ottdique codant pour une 
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enzyme impliqu6e dans la voie de biosynth6se des polyk6tides. I'enzyme 
PKS de type I, aussi d§sign6e p-k6toacyi synthase . 

On rappelle ici que les polyk6tides constituent une classe 
chimique d'une grande diversity structural comprenant un nombre 
5 important de mol6cules d'int6ret pharmaceutique tels que la tylosine, la 
monensine, la vermectine, r6rythromyclne, la doxorubicine ou encore le 
FK506. 

Les polyketldes sont synthetises par condensation de 
molecules d'acetate sous Taction d'enzymes appelees polyk6tide 

10 synthases (PKSs). II existe deux types de polyketide synthases. Les 
polykdtlde synthases de type II sont impliqu6es en general dans la 
synthase des antibiotiques aromatiques polycycliques et catalysent la 
condensation d'unit^s acetate de fagon iterative. 

Les polyk6tide synthases de type I sont impliqu6es dans la 

15 synthase des polyk6tides macrocycliques ou macrolides et constituent 
des enzymes modulaires multifonctionnelles. 

Compte-tenu de leur int6r§t th§rapeutique, il existe un besoin 
dans I'etat de la technique d'isoler et de caracteriser de nouvelles 
polyk6tides synthases qui peuvent etre utilis6es pour la production de 

20 nouveaux composes phamiaceutiques, notamment de nouveaux 
composes pharmaceutiques ^ activit6 antibiotique. 

Le criblage de la banque de clones recombinants d^crite ci- 
dessus a I'aide d'amorces PGR ampllfiant s6lectivement des s6quences 
nucteotidiques codant pour des polyk6tide synthases de type I a pemiis 

25 d'identifier des clones recombinants contenant des inserts d'ADN 
comprenant une sequence nucl6otidique codant pour de nouvelles 
polyk6tide synthases. Les sequences nucl§otidiques codant pour ces 
nouvelles polyketldes synthases sont referencees comme les sequences 
SEQ ID N'33 ^ SEQ ID NM4 et SEQ ID N'l 15 ^ SEQ ID N"120. 

30 Un autre objet de invention consiste en un acide nucleique 

codant pour une nouvelle polyketide synthase I, caract6rise en ce qu'il 
comprend I'une des sequences nucl6otidiques SEQ ID N*'34 d SEQ ID 
N°44 et SEQ ID N»115 SEQ ID NM20. 

De pr6f§rence, un tel acide nucleique se pr6sente sous une 

35 forme isolSe et/ou purifi^e. 
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L'invention concerne aussi un vecteur recombinant comprenant 
un polynucl6otlde comprenant Tune des sequences SEQ ID N°34 d SEQ 
ID N''44 et SEQ ID N"115 d SEQ ID N'120 

L'invention a egalement trait d une cellule hote recombinante 
5 comprenant un acide nucl6lque choisi parmi les polynucleotides 
comprenant Tune des sequences nucl6otidiques SEQ ID N''34 S SEQ ID 
N''44 et SEQ ID 115 ^ SDEQ ID N°120 ainsi qu'^ une cellule hdte 
recombinante comprenant un vecteur recombinant dans lequel est 
ins6r6 un polynucleotide comprenant I'une des sequences 
10 nucteotldiques SEQ ID N'34 d SEQ ID N°44 et SEQ ID N'1 1 5 S SEQ ID 
N'120. 

Avantageusement, les vecteurs recombinants contenant un 
insert d'ADN codant pour une nouvelle polyk6tide synthase de type I 
selon l'invention sont des vecteurs de clonage et d'expression. 
15 De preference, une cellule hote recombinante telle que d6crite 

ci-dessus est une bacterie. une levure ou encore un champignon 
filamenteux. 

Les sequences en acides amines de nouvelles polyk6tide 
synthases provenant d'organismes contenus dans un echantlllon de sol 

20 ont ete deduites des sequences nucl6otidiques SEQ ID N"'34 a SEQ ID 
N''44 ET SEQ ID N° 116 ^ SEQ ID N°120 ci-dessus. II s'agit des 
polypeptides comprenant I'une des sequences en acides amines SEQ ID 
NMS e SEQ ID N'SS et SEQ ID N» 121 d 126. 

L'invention concerne encore de nouvelles polyketides 

25 synthases comprenant une sequence en acides amines choisie parmi 
les sequences SEQ ID NMS S SEQ ID N'59 et SEQ ID N° 121 S SEQ ID 
N''126. 

Fait egalement partle de l'invention la sequence nucieotidique 
SEQ ID N'lU qui comprend six cadres ouverts de lecture qui cedent 
30 respectivement les polypeptides de sequences SEQ ID N''121 d SEQ ID 
N"126. 

Fait egalement partie de l'invention la sequence nucl6otidique 
SEQ ID NMia du cosmide a26G1, qui contient la sequence 
compiementaire de la sequence SEQ ID N°114. 
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On a aussi extrait et ampiifie selon I'invention de I'AON 
g6nomique provenant de souches bacteriennes pures, telles que 
Streptomyces coelicolor {ATCC N°101.478), Streptomyces ambofaciens 
(NRRL N°2.420), Streptomyces lactamandurans (ATCC N°27.382). 
5 Streptomyces rimosus (ATCC N'1 09.610), Bacillus subtilis (ATCC 
N°6633) ou encore Bacillus lichenifomis et Saccharopolyspora erythrea. 

Une amplification par PGR de I'ADN de chacune des souches 
bacteriennes decrites ci-dessus a ete effectu6e d I'aide des couples 
d'annorces sp^cifiques des sequences nucl§iques de polyk§tide 
10 synthase de type I. 

De nouveaux gdnes de polykStlde synthases de type 1 
bacteriennes ont ainsi pu Stre isoles et caract§ris6s. II s'agit des 
sequences nucl^iques de sequences SEQ ID N'SO d SEQ ID N°32. 

L'invention a done en outre pour objet des sequences 
15 nucleotidiques codant pour de nouvelles polyk6tides synthases de type I 
choisies parmi les polynucI6otides comprenant I'une des sequences 
nucleotidiques SEQ ID N'SO S SEQ ID N°32. 

Font 6galement partie de l'invention des vecteurs recombinants 
comprenant les sequences nucleotidiques codant pour de nouvelles 
20 poIyk6tides synthases de type I definies ci-dessus. 

L'invention concerne aussi des cellules hotes recombinantes 
caract6ris6es en ce qu'elles contiennent un acide nucleique codant pour 
une nouvelle polyk6tide synthase de type I comprenant une sequence 
nucl6otidique choisie parmi les s6quences SEQ ID N'SO a SEQ ID N°32 
25 ainsi que des cellules hdtes recombinantes comprenant un vecteur 
recombinant tel que d§fini ci-dessus. 

L'invention a ^galement pour objet des polypeptides codSs par 
des sequences comprenant les acides nucl6iques SEQ ID N" 30 d 32, et 
plus pr6cis6ment des polypeptides comprenant les sequences d'acides 
30 amines SEQ ID N" 47 ^ SEQ ID N" 50. 

L'invention a en outre pour objet un precede de production 
d'une polyk6tide synthase de type I selon I'invention, ledit proc6de de 
production comprenant les stapes suivantes: 
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- obtention d'une cellule hdte recombinante comprenant un 
acide nucteique codant pour une polyk6tide synthase de type I 
comprenant une sequence nucleotldlque cholsie parmi les s6quences 
SEQ ID N'33 d SEQ ID N«44. SEQ ID N'SO d SEQ ID N»32 et SEQ ID 
N»115^iSEQ ID NM20; 

- culture des cellules hates recomblnarites dans un milieu de 
culture approprle; 

- r6cup6ration et, le cas 6ch§ant, purification de la polyk^tide 
synthase de type I d partir du surnageant de culture ou du lysat 
cellulaire. 

Les nouvelles polyk6tide synthases de type I obtenues selon le 
precede d6crlt ci-dessus peuvent §tre caract6ris6es par fixation sur une 
colonne de chromatographie d'lmmuno-affinit6 sur laquelle des anticorps 
reconnaissant ces polyk6tides synthases ont 6t6 pr6alablement 
immobilises. 

Les polyk6tide synthases de type I selon I'invention, et plus 
particuli6rement les polyk6tlde synthases recombinantes d6crites ci- 
dessus peuvent 6tre aussi purifiees par des techniques de 
chromatographie liquide d haute perfomiance (HPLC). telles que par 
exemple des techniques de chromatographie en phase inverse ou de 
chromatographie d'6changes d'anions ou de cations, bien connues de 
I'homme du metier. 

Les polyk6tide synthases, recombinantes ou non 
recombinantes, selon I'invention peuvent §tre utilis^es pour la 
preparation d'antlcorps. 

Selon un autre aspect. I'invention a done encore pour objet un 
anticorps reconnaissant sp§cifiquement une polyketlde synthase de type 
I selon I'invention ou un fragment peptidique d'une telle polyk6tide 
synthase. 

Les anticorps selon I'invention peuvent §tre monoclonaux ou 
polyclonaux . Les anticorps monoclonaux peuvent 6tre pr6par6s d partir 
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de cellules d'hybrldome selon la technique d6crite par KOHLER et 
MILSTEIN C. (1975), Nature. Vol.256:495. 

Las anticorps polyclonaux peuvent §tre pr6par6s par 
immunisation d'un mammifdre. en particulier des souris, des rats ou des 
5 lapins avec une polyketide synthase de type I selon I'invention, le cas 
§ch6ant en presence d'un compose adjuvant de I'immunit6, tels que 
I'adjuvant complet de Freund, I'adjuvant incomplet de Freund, 
I'hydroxyde d'aluminium ou encore un compos6 de la famille des 
muramyl peptides. 

10 Constituent egalement des " anticorps " au sens de la pr6sente 

invention, les fragments d'anticorps tels que las fragments Fab, Fab'. 
F(ab')2, ou encore les fragments d'anticorps simple chaTne contenant la 
partie variable (ScFv) d6crits par MARTINEAU et al. (1998) J. Mol. Biol.. 
Vol.280 (1):117-127 ou encore dans le brevet US 4.946,778. ainsi que 

15 les anticorps humanises d6crits par REINMANN KA et al. (1997), AIDS 
Res. Hum. Retroviruses. vol.13(11):933-943 ou par LEGER O.J et al. 
(1997). Hum. Antibodies, vol.8 (1): 3-16. 

Les preparations d'anticorps selon I'invention sont utiles 
notamment dans des tests immunologiques qualitatifs ou quantitatifs 
20 visant, soit d simplement d6tecter la presence d'une polyketide synthase 
de type ! selon I'invention, soit d quantifier la quantity de cette polyk6tide 
synthase, par exemple dans le sumageant de culture ou le lysat 
cellulaire d'une souche bact6rlenne susceptible de produire une telle 
enzyme. 

25 Un autre objet de I'invention consiste en un proced6 de 

detection d'une polyketide synthase de type I selon I'invention ou un 
fragment peptldique de cette enzyme, dans un 6chantillon. ledit proc6d6 
comprenant les 6tapes de : 

30 a) mettre en contact un anticorps selon I'invention avec 

rechantillon d tester; 

b) detecter le complexe antigfine/anticorps 6ventuellement 

fomne. 

35 
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L'invention est 6galement relative d un kit ou necessaire de 
detection d'une polyk6tide synthase de type I selon invention dans un 
6chantillon, comprenant : 

a) un anticorps selon l'invention; 
5 b) le cas 6ch6ant, des r6actlfs n6cessaires d la detection du 

compiexe antig^ne/anticorps eventuellement form6. 

Un anticorps dirig6 contre une polyk6tide synthase de type I 
selon l'invention peut §tre marqu6 d I'aide d'un nrjarqueur detectable 
isotopique ou non isotopique. selon des proc6d6s bien connus de 
10 I'homme du m6tier. 

Le criblage d'une banque d'ADN selon l'invention d I'aide d'une 
paire d'amorces hybridant avec des sequences cibles dont la presence 
est recherch6e, telles que des sequences de la voie de biosynth^se de 
la puromycine. des sequences du g§ne linA impliquees dans la 
15 biod6gradation du lindane ou encore des sequences codant pour des 
polyk6tides synthases de type I ont detaill6es ci-avant. 

L'invention a done pour objet un proc6d6 de detection d'un 
acide nucl6ique de sequence nucl6otidique determin6e, ou de sequence 
nucieotidique structuralement apparentee d une sequence nucl6otidique 
20 determlnee. dans une collection de cellules hotes recombinantes selon 
l'invention, caracterise en ce qu'il comprend les etapes suivantes: 

- mettre en contact la collection de cellules hotes 
recombinantes avec un couple d'amorces hybridant avec la sequence 
nucieotidique detemiinee ou hybridant avec la sequence nucieotidique 

25 structurellement apparentee d une sequence nucieotidique determinee; 

- realiser au moins trois cycles d'amplification ; 

- detecter I'acide nucieique eventuellement amplifie. 

Pour les conditions d'amplification appropriees en fonction des 
30 sequences cibles recherchees, I'homme du metier pourra se referer 
avantageusement aux exemples ci-dessous. 

Selon un autre aspect, l'invention concerne aussi un precede 
de detection d'un acide nucieique, de sequences nucieotidlques 
detemninees, ou de sequences nucieotidlques structurellement 
35 apparentees d une sequence nucieotidique detemiinee, dans une 
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collection de cellules hotes recombinantes selon I'invention, caract6ris§ 
en ce qu'il comprend les Stapes suivantes: 

- mettre en contact la collection de cellules hdtes 
recombinantes avec une sonde hybridant avec la s6quence 

5 nucl6otldique determin6e ou hybridant avec une sequence nucl6otidique 
structureliement apparent6e k la sequence nucl6otidique d6termin§e; 

- detecter I'hybride 6ventuellement fomn6 entre la sonde et les 
acides nucl6iques compris dans les vecteurs de la collection. 

10 Pour effectuer le criblage d'une banque d'ADN selon I'invention 

en vue de d6tecter la presence d'une sequence nucl6otidique codant 
pour un polypeptide capable de d6grader le lindane, on a d6tect§ les 
clones recombinants d'int§ret par leur phSnotype correspondent d leur 
capacity d d6grader le lindane. Dans ce but, les clones Isolds et/ou des 

15 ensembles de clones de la banque d'ADN prSparde ont 6td mis en 
culture dans un milieu de culture en pr6sence de lindane et la 
degradation du lindane a 6t6 obsen/6e par la fomriation d'un halo trouble 
dans I'environnement imm§diat des cellules. 

I'invention concerne aussi un precede pour identifier la 
20 production d'un compost d'inter§t par une ou plusieurs cellules hotes 
recombinantes dans une collection de cellules hdtes recombinantes 
selon I'invention, caract6ris§ en ce qu'il comprend les etapes suivantes: 

- culture des cellules hdtes recombinantes de la collection dans 
un milieu de culture appropri§; 

25 - detection du compose d'int6ret dans le surnageant de culture 

ou dans le lysat cellulaire d'une ou plusieurs des cellules recombinantes 
cultivees. 

L'inventlon a en outre pour objet un proc6d6 pour s6lectionner 
une cellule hdte recombinante produisant un compose d'interSt dans une 
30 collection de cellules hotes recombinantes selon I'invention, caracterise 
en ce qu'il comprend les etapes suivantes: 

- culture des cellules hotes recombinantes de la collection dans 
un milieu de culture approprie; 
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- d6tection du compost d'int6r§t dans le sumageant de culture 
ou dans le lysat cellulaire d'une ou plusieurs des cellules hdtes 
recombinantes cultiv^es; 

- s6lection des cellules hdtes recombinantes produisant le 
5 compos6 d'int6rSt. 

L'Invention concerne encore un proced6 pour la production d'un 
compos6 d'int6r§t caract6rls6 en ce qu'il comprend les etapes sulvantes: 

- cultlver une cellule hdte recombinante selectionn6e selon le 
10 proc^d^ dScrit ci-dessus; 

- r6cup6rer et, le cas 6ch6ant, purifier, le compos6 produit par 
ladite cellule hdte recombinante. 

L invention est 6galement relative ^ un compos6 d'int6r€t 
caract6ris6 en ce qu'il est obtenu selon le proc6d6 ci-dessus d6crit. 
15 Un compose d'Intergt selon invention peut consister en un 

polyk6tide produit grace a I'expression d'au moins une sequence 
nuc!6otidique comprenant une s6quence choisie parmi les sequences 
SEQ ID N'Sa d 44, SEQ ID N'SO d 32 et SEQ ID N'115 d SEQ ID 
N"'120. 

2° L'invention conceme encore une composition comprenant un 

polyk6tide produit grSce d I'expression d'au moins une s§quence 
nucl6otidique comprenant une sequence choisle pamii les s6quences 
SEQ ID N°33 a SEQ ID N»44, SEQ ID N'30 d SEQ ID N'32. et SEQ ID 
NMISSSEQ ID N'120. 

2^ Un polyk§tide produit grace d I'expression d'au moins une 

sequence nucl6otidique ci-dessus est pr6f§rentiellement le produit de 
('activity de plusieurs sequences codantes incluses au sein d'un op6ron 
fonctionnel dont les produits de traduction sont les diff6rentes enzymes 
n6cessaires ^ la synthase d'un polyk6tide, I'une des s6quences ci- 

30 dessus etant comprise et exprim§e dans ledit operon. Un tel op6ron 
comprenant une sequence d'acide nucteique selon l'invention codant 
pour une polyk6tide synthase peut etre construit par exemple selon 
I'enseignement de Borchert et al. (1992). 

L'invention est encore relative d une composition 

35 pharmaceutique comprenant une quantity pharmacologiquement active 
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d'un polyk6tide selon ('invention, le cas 6ch6ant en association avec un 
v6hicule pharmaceutiquement compatible. 

De telles compositions phamiaceutlques seront 
avantageusement adaptees pour I'administration, par exemple par voie 
5 parenterals, d'une quantity d'un polyk^tlde synth6tis6 par une polyl<6tide 
synthase de type I selon I'Invention allant de1|jg/kg par jour d 10 mg/kg 
par. jour, de preference au moins 0,01 mg/kg par jour et de maniSre tout 
a fait pr6f6r6e entre 0,01 et 1 mg/kg par jour. 

Les compositions phamiaceutiques selon invention peuvent 
10 etre indiff6remment administr6es par voie orale, rectale, parent6rale, 
intraveineuse, sous-cutan6e ou encore intrademiique. 

L'invention concerne aussi {'utilisation d'un polyk6tide obtenu 
grace ^ I'expression d'une polyk6tide synthase de type I selon I'Invention 
pour la fabrication d'un m6dicament, en particulier d'un medicament d 
15 activity antibiotique. 

L'invention sera en outre illustree. sans pour autant §tre Iimit6e, 
par les figures et les exemples ci-apres. 

La figure 1 illustre le schema des diff§rentes 6tapes de lyse 
20 effectu6es selon les protocoles 1. 2. 3n 4a. 4b. 5a. et 5b d6crits d 
I'exemple 1. 

La Figure 2 illustre une. 6lectrophor§se sur gel d'agarose 0.8% 
des ADN extraits d partir de 300 mg du sol n'3 (C6te St Andr6) aprds 
diff6rents traitements de lyse (protocoles 1 5. cf. Fig. 1). M : marqueur 
25 de poids moieculaire de phage lambda 

La Figure 3 illustre la proportion de diff6rents genres 
d'actinomycetes cultives a la suite des traitements 1 a 5 (cf. Fig. 1). Le 
nombre d'ufc (unite formant colonie) a ete determine sur un milieu 
30 seiectif pour ce groupe de bacteries. Un nombre total d'environ 400 
colonies a ete analyse. 

La Figure 4 illustre la. recuperation d'ADN de phage lambda 
digere par H/ndlll additionne dans les sols d differentes concentrations 
35 avant (G) ou apres (G*) broyage. Les traitements T (chocs thermlques) 
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et S (sonication) sont des traitements additionnels de lyse. La 
quantification a 6t6 r6alis6e par analyse au phospho-lmageur apr6s 
hybridation en dot-blot. Un 6chantillon de chaque sol a §t6 utilise pour 
chaque concentration de phage lambda ajout6. Les caract6ristiques des 
5 sol sont reproduites dans le tableau 1 . Les 6chantillons correspondant d 
10 et 15 pg d'ADN ajoute n'ont pas 6te traites. 

La Figure 5 illustre ramplification par PGR des ADN extraits a 
partir de sol n°3 selon les protocoles 1. 2, 3, 5a et 5b. Les amorces 
10 FGPS 122 et FGPS 350 (tableau 2) ont et6 utilises afin de cibler 
Streptosporangium spp. indigenes. Les extraits d'ADN ont 6t6 utilises 
non diluSs ou dilu^s au 1/10*"' et 1/100*"" . M : marqueur de poids 
mol6culaires 123 pb ( Gibco BRL). C : contrfile d'amplification sans ADN. 

15 La Figure 6 illustre les quantit6s d'ADN extrait aprds inoculation de 

spores (a) ou de mycelium (b) de S. IMdans OS48.3 inocul6s dans les 
sols d diff6rentes concentrations. La quantlt^s de mycelium ajout§e dans 
le sol correspond au nombre de spores inoculees dans le milieu de 
germination. Environ 50% des spores ont germe. le nombre de cellules 

20 ou de g6nomes contenues dans les hyphes des spores germ6es n'a pas 
6t6 d6temiln6. Les quantit6s de spores et de mycelium inocul6es ne 
sont done pas directement comparables. Le protocole d'extraction a §te 
mene selon le protocole 6 (cf. section materiel et m6thodes). Le symbole 
(') indique que de I'ARN a 6t6 Indus dans le tampon d'extraction. L'ADN 

25 cible a 6t6 ampllfie par PGR avec les amorces FGPS 516 et FGPS 517, 
la quantification a 6t6 r§alisee par phosphoimageur aprds hybridation en 
dot blot en utilisant le sonde FGPS 518. Un 6chantillon de chaque sol a 
6t6 utilise pour chaque concentration d'hyphes ou de spores. Les 
caract6ristiques des sols sont d6crites dans le tableau 1. 

30 

La figure 7 represente I'arbre phylog6netique obtenu par 
Talgorithme de Neighbour Joining . positionnant les s§quences d'ADNr 
16S contenues dans la banque d'ADN du sol, par rapport d des 
bact6ries de r^f^rences cultiy^es. 
35 En gris6:.les s6quences issues des pools de clones de la banque. 
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Les valeurs de bootstrap sont indiquSes au niveau des noeuds, 
apres r66chantillonnage de 100 r6petitions. La barre d'6chelle indique le 
nombre de substitutions par site. Le num6ro d'accds des s6quences 
5 dans la base de donn^es Genbanl< est indlqud entre parentheses. 

La figure 8 repr^sente un schema du vecteur pOSint 1 . 

La figure 9 repr^sente un sch^nna du vecteur pWED1 . 

10 

La figure 10 repr6sente un schema du vecteur pWE15 (ATCC 
N' 37503). 

La figure 11 repr§sente un sch6ma du vecteur pOS 7001. 

15 

La figure 12 represente un schema du vecteur pOSVOIO. 

La figure 13 represente le fragment contenant un site " cos " 
ins§r6 dans le plasmide pOSVOlO au cours de la construction du vecteur 
20 pOSV 303. 

La figure 14 repr6sente un sch6ma du vecteur pOSV 303. 

La figure 15 represente un schema du vecteur pE1 16. 

25 

La figure 16 represente un schema du vecteur pOS 700 R. 
La figure 17 represente un schema du vecteur pOSV 001. 
30 La figure 18 represente le schema du vecteur pOSV 002. 

La figure 19 represente un schema du vecteur pOSV 014. 
La figure 20 represente un schema du vecteur pBAC 1 1 . 
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La figure 21 repr^sente un schema du vecteur pOSV 403. 

La figure 22 reprdsente les gels d'electrophordse d'ADN de la 
banque apr^s digestion par les enzymes BamHI et Oral des clones 
s positifs de la banque criblee avec les oligonucleotides PKS-I. 

La figure 23 illustre la production de puromycine par les 
recombinants de S. IMdans compar^e h la production de la souche 
sauvage S. alboniger. 

10 

La Figure 24 illustre Alignement de PKSs du sol avec les sites 
actifs consen/^s d'autres PKSs. Les references pour cheque peptide 
sont indiquees. Les domaines b§ta-k6toacyl synthase ont ete alignSs en 
utilisant le programme PILEUP de GCG (Wisconsin Package Version 
15 9.1 , Genetics Computer Group, Madison, Wise). 

La Figure 25 illustre la construction d'un cosmide Integratif 
conjugatif. 

20 La Figure 26 Illustre la construction d'un BAG integratif 

conjugatif. 

La figure 27 illustre le schema de construction du vecteur pOSV 

308. 

25 

La figure 28 illustre le schema de construction du vecteur 
POSV306. 

La figure 29 illustre le schema de construction du vecteur 

30 POSV307. 

La figure 30 illustre le sch6ma de construction du vecteur 

PMBD-1. 
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La figure 31 pr6sente une carte d6taill6e du plasmlde pMBD-2 
ainsi qu'un sch6ma de construction du vecteur pMBD-3. 

La figure 32 illustre une carte d6taill6e du plasmide pi\/IBD-4. 

5 

La figure 33 illustre le schema de construction du plasmide 
pMBD-5 d partir du plasmide pMBD-1. 

La figure 34 illustre la carte dStaillSe du vecteur pBTP-3. 

10 

La figure 35 illustre le schema de construction du vecteur 
pMBD-6 d partir du vecteur pMBD-1. 

La figure 36 illustre la carte du cosmide a26G1 dont {'insert 
15 d'ADN contient des cadres ouverts de lecture codant pour plusieurs 
polyk^tides synthase. 

La figure 37 est un schema representant I'insert d'ADN (brin +) 
du cosmide a26G1, sur lequel sont positionnes les diff6rents cadres de 
20 lecture codant pour plusieurs polyketides synthase. 

EXEMPLES: 

EXEMPLE 1: Proced6 de pr eparation d'une collection d'acides 
nucleiaues i part ir d'un ichantillon de sol contenant dea 
25 orqanismes. compren ant une 6taoe d'extraction directe d'ADN a 
partir de l'6chantil[on de soL 

1. MATERIEL ET METHODES 

30 1-1 SOLS: Les caract6ristiques des six sols utilises dans cette 

6tude sont Iist6es dans le tableau 1. 

La teneur en argile et en mati6re organique va respectivement 
de 9 ^1 47% et de 1 .7 d 4,7%, le pH variant de 4,3 d 5,8. 

Des 6chantillons de sol ont 6t6 collect6s d partir de la couche 
35 superficielle de 5 ^ 10 cm de profondeur. Toutes les racines visibles ont 
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6t6 6limin6es et les sols ont 6t6 conserves d 4°C pendant quelques jours 
si n6cessaire, aprds quo! ils ont 6t§ s6ch6s pendant 24 heures d la 
temp6rature amblante et tamis^s (tallle moyenne de maille 2 mm) avant 
d'§tre conserves jusqu'd plusieurs mois A A'C. 

5 

1.2 SOUCHES BACTERIENNES ET CONDITIONS DE CULTURE: 

L'ADN extracellulaire ainsi que les souches bacteriennes foumissant des 
cellules v§getatives, des spores ou des hyphae, utilisees pour Innoculer 
les 6chantillons de sol, ont ete choisies de telle sorte que leur presence 

10 puisse etre suivie sp6clfiquement. 

Afin d'obtenir de grandes quantit^s d'ADN extracellulaire, la 
souche lysog^nique de £co// 1192 Hfr P4X (metB), contenant le phage 
lambda CI857 Sam7, a 6t6 cultivSe sur milieu Luria-BertanI (LB) pendant 
deux heures d 30*0, puis 30 minutes d 40''C, puis 3 heures d Z7'C. 

IS L'ADN du phage lambda a 6t6 extrait selon la technique dScrite par 
SAMBROOK J. et al. (1989) Molecular Cloning: A Laboratory Manual, 
2nd, ed. Cold Spring Harbor Laboratory, Cold Spring Harbor N.Y. 

La souche avirulente de Bacillus anthracis (STERNE 7700) a 
6t6 utilis§e comme inoculum de cellules bacteriennes. Bacillus anthracis 

20 a 6te multipli6 sur un bouillon de culture de type " trypticase soy broth " 
(TSB) (Biom§rieux, Lyon, France) pendant environ 6 heures, en verifiant 
que la DOeoo soit maintenue en dessous de 0.6. Ces conditions 
permettent le d^veloppement des cellules v§g§tatives sans fomnation de 
spores (Patra et al„ (1996), FEMS Immunol. Medical Microbiology, 

25 vol. 1 5:223-231 .). Les spores de Streptomyces lividans OS48.3 (CLERC- 
BARDIN et al. non public) ont §t§ Slimin§es mScaniquement des 
cultures de I'organisme sur un milieu R2YE (NORWOOD et al., (1985), 
Genetic Manipulation of Streptomyces-A Laboratory Manual. The John 
Innes Foundation , Nonwich .United Kingdom). Les hyphae de S.lividans 

30 0S48.3 ont 6t6 obtenus S partir des spores en pr6-gennination, car Ton 
s'attendait a ce que I'utilisation de hyphae courtes minimise la rupture et 
la perte subsequente d'ADN. Les spores ont 6t6 mises en suspension 
dans du tampon TES (Acide N-Tris [hydroxym6thyl]m6thyl-2- 
amino6thanesulfonique ; Sigma-Aldrich Chimie, France) (0,05M; pH 8) 

35 (Holben WE et al., (1988), APPL. Environ. Microbiol. vol.54:703-711, 
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puis ont 6t6 soumises d un choc thermique (50°C pendant 10 minutes 
suivi d'un refroidissement sous un courant d'eau froide puis ajoutSes d 
un volunne egal de milieu de pr6-gennination (extrait de levure 1%, 
casaminoacides 1% CaCb 0.01 

La solution a et^ Incub^e d 37°C sur un agitateur. La proportion 
de spores germ6es a 6t6 estim6e a environ 50%, en accord avec les 
r6sultats de HOPWOOD et al. (1985). Apr§s centrifugation. les culots ont 
6te resuspendus dans du tampon TES, ajoutes ^ 3% de milieu TSB, et 
incubes a SyC jusqu'^i I'obtention d'une DO450 de 0,15 (HOPWOOD et 
al. , (1985)). Streptomyces hygroscopicus SWN 736 et 
Streptosporangium fragile AC1296 (Institute Pushino. Moscou) ont ^t6 
cultiv^s salon des techniques d6crites par HICKEY et TRESNER (1952). 

L'ADN des spores et des hyphae de S. Lividans a 6t6 extrait d 
partir des cultures pures selon le protocole de lyse 6 decrit ci-dessous 
(excepts qu'aucun broyage n'a StS r§alis6), tandis que les spores de S. 
hygroscopicus et de S. fragile ont 6t6 extraites par lyse 
chimique/enzymatique (Hintermann et al., 1981). 

1.3 CHOIX DU TAMPON D'EXTRACTION: Un tampon TENP (50 mM 
Tris, 20 mM EDTA, 100 mM NaCI, 1% pds/vol de 
polyvinylpolypyrrolidone d6velopp6 par PICARD (1992) a 6t§ utilise. Des 
tampons similaires ont §t§ ulterieurement utilises par d'autres auteurs 
(CLEGG et al.. 1997; KUSKE et al.. 1998; ZHOU et al.. 1996). 

Le Tris et I'EDTA protSgent I'ADN de I'activitS nucl6ase. le NaCI 
apporte un effet dispersant et la PVPP absorbe les acides humiques et 
les autres composes phSnoliques (HOLBEN et al. (1988); PICARD et al., 
(1992). 

Dans cette Stude, I'efficacitS d'extraction de ce tampon a 6t6 
6valu6e d differents pH (6,0 - 10,0) en utilisant 20 sols diff6rents ayant 
une gamme de pH de 5,8 ^ 8,3 et une teneur en matiere organique entre 
0,2 et 6,3%. Ces vingt sols (les autres caracteristiques ne sont pas 
IndiquSes) ont StS utilises uniquement dans cette experience. La quantite 
d'ADN a 6t6 determin6e de manifere colorim6trique comme d6crit par 
RICHARD (1974). et detaill6 ci-apr6s. 
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1.4 PROTOCOLE DE LYSE IN SITU ET D'EXTRACTION D'ADN: 
Plusieurs protocoles utilisant un nombre croissant d'6tapes ont §t6 
testes afin d'evaluer I'efficacite de diff6rentes techniques pour lyser les 
microbes du sol in situ. Pour ces experiences, la microflore indigene du 

5 sol a 6t6 cibl§e dans six sols. Des experiences additionnelles ont ete 
conduites afin d'§tudier les effets des traitements de lyse sur I'ADN 
Iib§r6, en analysant les quantites et la qualite d'ADN r6cup6re provenant 
d'un ADN de phage lambda prealablement addltlonn6 aux sols. 

Une fois qu'un protocole optimise (d§signe protocole 6) a et§ 

10 d6velopp§, ce protocole a 6t6 utilise pour quantifier I'ADN provenant 
d'Actinomyc^tes indigenes et d'ADN provenant de bacteries Gram- 
positives inocuiees dans les sols seiectionnes. Dans tous les cas, les 
echantiilons de sol ont ete seches et passes au tamis comme decrit ci- 
dessus. 

15 Apres broyage, 0,5 ml de tampon TENP ont et6 ajoutes d 200 

mg poids sec de sol excepte pour le protocole 1 dans lequel le tampon a 
ete ajoute e un sol non broye). 

Pour les divers traitements de lyse (voir ci-dessous), les 
suspensions de sol ont ete passees au Vortex pendant dix minutes et 

20 centrifugees (4000 g pendant cinq minutes), apres quoi une fraction 
aliquote (25 du surnageant a 6te analysee par eiectrophorese sur gel 
(0.8% d'agarose). 

Une autre fraction aliquote du surnageant representant un 
volume connu, generalement 350 pi, a ete precipitee avec de 

2S I'isopropanol. 

Cinq fractions aliquotes (representant de I'ADN derive de 1 g de 
sol) ont ete reunies et resuspendues dans 100 pl d'un tampon IE sterile 
(10 mM Tris, 1 mM EDTA, pH 8,0) avant purification (protocole D, voir ci- 
dessous) et quantification, soit par hybridation (Dot Blot) de I'ADN total, 

30 soit par hybridation (Dot Blot) des produits d'amplification PGR (voir ci- 
dessous). 

Les signaux d'hybridation ont ete quantifies par imagerie par 
phosphorescence (technique de " phospho-imaging " voir ci-dessous). 
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1.5 EVALUATION DES METHODES DE LYSE CELLULAIRE IN SITU: 
La quality et la quantity de I'AON extralt aprds un nombre croissant 
d'etapes de traitement de lyse (protocole 2-5b) ont 6te compar§es d 
celles de I'ADN extraceliulaire obtenu aprds lavage du sol avec un 
5 tampon d'extraction (protocole 1 ; voir aussi figure 1). 

Protocole 1: Pas de traitement de Ivse. 

Le tampon TENP a dt6 ajoute ^ un sol non broy6, une 6tape 
10 d'extraction d'ADN a 6t6 r6alis6e comma d6crlt ci-dessus. 

Protocole 2. Brovaqe du sol suivi d'une extraction d'ADN. 

Deux types de dispositifs diff^rents ont 6te utilises pour le 
IS broyage du sol. 

Afin de comparer leur efficacit6 respective, 5g de sol sec ont 
et6 broy6s pendant 30 secondes dans un broyeur contenant des 
anneaux de tungstdne, ou pendant des temps varies jusqu'd 60 minutes 
dans un broyeur de sol contenant un mortier et des billes en agate (20 
20 mm de diametre). 

Le tampon TENP est ensuite ajoute et I'ADN est extrait comme 
ddcrit ci-dessus. 

Les r6sultats d'6lectrophor6se sur gel ont montr6 qu'un broyage 
de 40 minutes en utilisant des billes en agate ^taient ndcessaires afin 
25 d'obtenir des quantit^s d'ADN extralts 6quivalentes d celles obtenues 
apr^s 30 secondes de broyage en utilisant des anneaux de tungstSne. 

La distribution de taille des fragments d'ADN est similaire quelle 
que solt la m6thode employee. 

Ainsi, ces traitements ont ete consider^s comme §quivalents et 
30 celui qui sera utilise dans les protocoles d6crits ci-dessous ne sera en 
consequence pas spScifi^. 

Dans les protocoles 3 A 5, refficacit^ de plusieurs autres 
traitements de lyse ulterieure au broyage du sol a 6te testae, soit 
s6par§ment, soit dans differentes combinaisons. 

35 
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Protocole 3 : 

Ce protocole est identique au protocole 2 , sauf qu'il comprend 
une 6tape d'homogenSisatlon i I'alde d'un mlxeur de type Uttraturrax 
s (Janker et Kunkel. IKA Labortechnik, Allemagne) r6gl6 d la moitid de la 
Vitesse maximale pendant 5 minutes. 

PROTOCOLES 4a et4b: 

10 Ces protocoles sont identiques au protocole 3 a I'exception 

d'une 6tape additionnelle de sonlcation. 

Deux types de dispositife sonicateurs ont 6t^ compares : un 
sonicateur d micropointe de titane (600W Vibracell Ultrasonicator, 
Biobiock, lllkirch, France) (Protocole 4a) et un sonicateur de type Cup 
15 Horn (protocole 4b). 

La micropointe Vibracell produisant des uKrasons est en 
contact direct avec la solution de sol. 

En ce qui concerne le dispositif de type Cup Horn, la solution de 
sol est conserv6e dans des tubes qui sont places dans un bain d'eau A 
20 travers lequel passent les ultrasons. 

Des experiences pr6liminaires ont 6t6 r6alis6es afin de 
determiner les conditions optimales pour les deux sonicateurs (r§sultats 
non pr6sent6s). 

Le meilleur compromis, en terme de quantity d'ADN extrait et 
25 de taille de fragments, consiste en une sonicatlon avec la micropointe de 
titane et le sonicateur de type Cup Horn respectivement pendant 7 et 10 
minutes, en rSglant la puissance d 15 W et avec des cycles actife d 50%. 

Protocoles 5a et 5b: 

30 

Apr6s sonicatlon avec une micropointe de titane ou un dispositif 
de type Cup Horn (respectivement protocoles 4a et 4b) du lysozyme et 
de I'achromopeptidase ont 6t6 ajout6s, chacune des enzymes d une 
concentration finale de 0,3 rtig/mi. 
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Les suspensions de sol ont incubees pendant 30 minutes d 
ZTC. apr&s quoi du lauryl sulfate d une concentration finale de 1 % a 
§t6 ajoutS, puis des suspensions ont ^te incubees pendant 1 heure d 
60°C avant centrifugation et precipitation comme dScrit ci-dessus. 

5 En plus des protocoles d^crits ci-dessus, I'efFet de la sonication 

(Cup Horn, voir protocole 4b) et de chocs thermiques (30 secondes dans 
I'azote liquide suivi de trois minutes dans I'eau bouillante, les traitements 
etant repetes trois fois ) sur I'ADN de phage lambda diger6 par Hindlll 
pr6alablement ajoute au sol ont 6te examines (voir ci-apr6s). 

10 Des chocs thermiques ont 6t6 sugg6r6s dans I'etat de la 

technique comme des moyens de lyse cellulaire in situ (PICARD et al. 
(1992)).. Cependant, du fait qu'un tel traitement a un effet 

prSjudiciable sur I'ADN libre (voir la section r^sultats) il n'a pas 6t6 inclus 
dans les protocoles dScrits ci-dessus. 

15 

PROTOCOLE OPTIMISE 

Apr6s evaluation des diff§rents traitements de lyse, un 
protocole optimist a 6t6 defini, d§sign6 protocole 6 . Le protocole 6 est 

20 identique au protocole 5b excepte que, avant la sonication, les 
suspensions de sol sent soumises d un traitement par Vortex puis 
agitees par rotation sur une roue pendant deux heures avant d'Stre 
congel6es d - 20''C. 

Apr^s d^congSlation, les suspensions de sol sont pass^es au 

25 Vortex pendant 10 minutes avant sonication. Le protocole 6 a 6t6 utilise 
dans les experiences dans lesquelles les sols ont ete ensemencSs avec 
des cellules bacteriennes ainsi que dans les experiences dans lesquelles 
les actinomyc6tes indigenes ont 6t§ quantifies (voir ci-dessous). 

30 1 .6 COMPTAGE AU MICROSCOPE: L'efficacite du broyage du 

sol comme methode pour lyser des cellules bacteriennes a ete examinee 

au microscope. 

5g de sol bmt seche ont 6te melanges dans un dispositif de 
type Waring Blender avec 50 ml d'eau sterilisee ultrapure pendant 1 ,5 
35 minutes; simultanement, 1g (poids sec) de sol broye (protocole n*'2) a 
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ete mis en suspension dans 10 ml par agitation pendant 10 minutes. Les 
suspensions de sol ont fait I'objet de dilutions en series et de racridine 
orange a §te ajout^e d une concentration finale de 0,001%. 

Aprds 2 minutes, les suspensions ont filtrdes d travers une 
s membrane de marque NUCLEOPORE de type 0,2 pm black. Chaque 
filtre a ^t§ mg& avec de I'eau sterile lysSe. traitSe avec 1 ml 
d'isdpropanoi pendant 1 minute afin de fixer les cellules bacteriennes, 
puis rinc6 de nouveau. 

Les cellules bacteriennes ont ete comptees d I'alde d'un 
10 microscope a ^pifluorescence du type Zeiss Universal avec un objectif 
lOOx. Pour chacun des types de sol, trois filtres ont 6te comptSs, et au 
moins 200 cellules ont §t6 comptees sur chacun des filtres. 

1.7 NUMERATION DES ACTINOMYCETES CULTIVABLES ET 
IS NOMBRE TOTAL D'UNITES FORMANT COLONIES (CFU): Les 
actinomyc^tes ayant survScu aux traitements de lyse (protocoles 1-5) 
ont 6t§ examines sp6cifiquement avec le sol n'3 (C6te Saint Andr6, voir 
tableau 1). 

Apr6s une dilution de 10 fois d'une solution d'extralt de levure 
20 (6% poids/volume) et de SDS (0,05%) afin d'induire la gemiination 
(Hayakawa et al. (1988)), les suspensions de sol ont §te dilutes en 
series dans de I'eau sterile, incubees d 40°C pendant 20 minutes et 
ensemenc6es sur du milieu HV (HAYAKAWA et al., 1987). 

Le milieu HV a 6t6 additionn^ de actidione (50 mg/l) et de 
2S nystatine (50 mg/ml). 

Les colonies d'actinomyc§tes ont 6t§ comptees aprds 
incubation pendant 15 jours d 28''C. 

Au total, environ 400 colonies ont 6t6 examin6es. 
L'identification a ^td r^alisee sur la base des caractSristiques 
30 morphologiques macro-et microscopiques ainsi que sur I'analyse de la 
teneur en acide diaminopim^lique des isolats (SHIRLING et al., 1966); 
STANECK et al., 1974; WILLIAMS et al.,1993). 

La quantity totale de bact^ries cultivables (CFU totales) a et6 
6galement detemiinee pour chacun des protocoles de lyse 1 d 5. Les 
35 suspensions de sol ont 616 dilutes en s^rie et ensemenc^es en triple sur 
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un milieu agar Bennett (WAKSMAN et al., 1961} additionn§ de nystatine 
at d'actidione (chacune d 50 mg/l). 

Chaque boTte de PStri a 6t6 couverte d'un filtre de nitrate de 
cellulose (Mlllipore) et incubSe pendant trois jours d 28''C. Aprds la 
s numeration des colonies sur les membranes, les filtres ont 6t6 retirees et 
les boTtes de P&tn ont §t6 d nouveau incubees pendant 7 jours d 28*'C 
puis comptSes d nouveau. 

1.8 RECUPERATION DE L'ADN DE PHAGE LAMBDA AJOUTE AUX 
10 SOLS: L'ADN de phage lambda a et^ dig§re avec Hindlll, extrait par un 
melange de phenol-chioroforme, precipit^ puis resuspendu dans de I'eau 
sterile ultrapure selon des protocoles standard (SAMBROOK et 
al.,1989). 

Des dilutions correspondant respectivement a 0, 2,5, 5, 7,5, 10 
IS et 15 pg d'ADN/g de poids sec de sol ont et6 pr^parSes dans des 
volumes de 60 pi. Ces dilutions d'ADN ont 6t6 ajout§es d des lots de 5g 
de sol sec qui ont 6te subs^quemment vigoureusement m^iangSs par 
vortex pendant 5 minutes avant broyage. 

L'ADN de phage lambda a aussi ajoutS a un sol avant 
20 broyage a des concentrations correspondant d 0, 10 et 15 pg d'ADN/g 
de poids sec du sol. 

Apr^s broyage, le tampon d'extraction est ajout6 et I'ADN est 
extrait selon le protocole 2(voir ci-dessus). 

25 1.9 SATURATION DES SITES D'ADSORPTION AVEC DE L'ARN: Afin 
de determiner si la saturation des sites d'adsorption d'acides nuclSiques 
des colloYdes du sol pouvait augmenter le taux de r§cup6ration de I'ADN, 
le ten-eau sablonneux (sol nM) et le sol argileux (sol n°5) ont 6t6 
incubus avec une solution d'ARN avant tout autre traitement. 

30 De I'ARN commercial de Saccharomyces cerevisiae 

(BOHRINGER IVIANNHEIM, MEYLAN. France) a 6t6 dilu6 dans du 
tampon phosphate (pH 7,1) et ajoute aux echantillons de sol sec et 
tamis6s (2 ml/g de sol) d des concentrations finales de 20, 50 et 100 mg 
d'ARN/g de poids sec du sol. 
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Les tubes contenant les suspensions de sol ont 6t6 agit^s par 
rotation pendant deux heures A temperature ambiante. Apr^s 
centrifugation, les culots de sol ont §t6 s^ch^s au four (50°C) pendant la 
nuit. L'ADN de phage lambda a ensuite et6 ajoutS aux sols (0, 20 ou 50 
s |jg/g de poids sec du sol) afin de simuler le sort de I'ADN lib^r^ apr^s 
lyse cellulaire. 

L'ADN a 6t6 extrait selon le protocole ^"2. II a 6t§ determine par 
la suite qu'un effet identique de I'addition d'ARN sur la recuperation 
d'ADN pouvait §tre atteint en ajoutant I'ARN directement au tampon 
10 d'extraction. 

Cette procedure simplifiee a ete utilisee pour le sol argileux n°5 
dans les experiences dans lesquelles les micro-organismes ont ete 
inocuies dans les sols. 

L'ARN a ensuite ete ajoute d une concentration correspondant 
IS d 50 mg d'ARN/g de poids sec du sol. 

1.10 DETERMINATION QUALITATIVE ET QUANTITATIVE DE 
L'EFFICACITE DES PROTOCOLES D'EXTRACTION: La qualite de 
I'ADN (absence de degradation) a ete estimee sur la base de la taille des 

20 fragments d'ADN ou de la position relative des bandes de migration 
d'ADN apres eiectrophorese d'une fraction aliquote d'une solution d'ADN 
sur un gel d'agarose e 0,8%. 

L'intensite de fluorescence a pemiis une estimation semi- 
quantitative des rendements d'extraction. 

25 Une autre fraction aliquote a ete utilisee pour des 

detemninations quantitatives de la teneur en ADN par hybridation (Dot 
Blot) et analyse au phospho-lmager. Le protocole d'hybridation sur tache 
a ete decrit par SIMONET et al. (1990). 

Les membranes d'hybridation (GeneScreen plus, Life Science 

30 Products, Boston, Etats-Unis d'Am6rique) ont ete prehybridees pendant 
au moins 2 heures dans 20 ml d'une solution contenant 6 ml de 20 x 
SSC. 1 ml de solution de DENHARDT's, 1 ml de SDS S 10% et 5 mg 
d'ADN de spemie de saumon. 

L'hybridation a ete realisee pendant une nuit dans la meme 

35 solution en presence d'une sonde marquee prealablement d deux 
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lavages des membranes dans un tampon SSC 2 x pendant 5 minutes d 
temperature ambiante, puis un troisieme lavage dans du tampon SSC 2 
X, SDS 0.1% et un quatriSme lavage dans du tampon SSC 1 x, SDS 
0,1% pendant 30 minutes d la temperature d'hybridation. 
5 Les signaux d'hybridation ont ete quantifies avec un systeme 

d'imagerie radioanalytique BIORAD (Molecular Analyst Software, 
BIORAD, Ivry S/Seine, France). 

Afin de quantifier la quantity totale d'ADN d^rivee de la 
microflore indigene, les diff^rents sols ont ete extraits selon les 
10 protocoles n°1 d 5. L'ADN non amplifie a ete applique sur les 
membranes de Dot Blot et hybride en utilisant la sonde universelle 
FGPS431 (tableau 2). 

Cette sonde, qui hybride aux positions 1392-1406 du gene de 
I'ADNr 16S de E.coli (Amann et al. (1995)) a ete marquee a ses 
15 extremites avec un ATPa^^P en utilisant une polynucleotide kinase 
T4(B0EHRINGER MANNHEIM, Melan, France). 

Une courbe de calibration a 6te preparee d partir de I'ADN de 
E.coli DH5a. La conversion des calculs aux bacteries du sol a necessite 
une simplification, partant de I'hypothese que le nombre de copies 
20 moyen (rrn) est de 7, comme pour E.coli. 

L'ADN de phage lambda digere par Hindlll a 6te utilise pour 
quantifier la recuperation de I'ADN extracellulaire. Des extraits non 
amplifies a partir de sols, auxquels de I'ADN de phage lambda avait ete 
ajoute, ont ete hybrides avec de I'ADN de phage lambda digere par 
2S Hindlll marque au hasard en utilisant le fragment Klenow (Bdehringer 
Mannheim, Melan, France). 

Les quantites d'ADN ont ete calcuiees par interpolation d partir 
d'une courbe de calibration pr6paree avec I'ADN purifie. 

La quantlte totale d'ADN extrait d partir des sols n°1, 2, 3, 4 et 6 
30 selon le protocole n°2 (broyage) a egalement ete quantifiee de manifere 
colorimetrique selon la technique decrite par RICHARD (1974). 

Brievement, de I'ADN a ete melange avec du HCIO4 concentre 
(la concentration finale de HCIO4 etait de 1,5 N). On a melange 2,5 
volumes de cette solution avec 1.5 volumes de DPA (diphenylamine, 
3S Sigma-Aldrich, France) et laisse incuber le melange d la temperature 
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ambiante pendant 18 heures, pr^alablement d la determination de la DO 
d 600 nn. Les extraits d'ADN du sol ont 6t6 quantifies par rapport ^ une 
courbe standard rSalisee par I'ADN extrait d parttr de E.coli DH5a selon 
les protocoles standards (SAMBROOK at al., (1989)). 

5 

1.11 DEVELOPPEMENT D'UNE TECHNIQUE DE QUANTIFICATION 
D'ADN EN UTILISANT L'AMPLIFICATION PCR ET L'HYBRIDATION: 
Pour les amplifications par PCR, de I'ADN polymerase Taq (Appligene 
Oncor, France) a 6t6 utilise seion les instructions du fabricant. 

10 Le programme PCR utilise pour toutes les amplifications est le 

suivant: denaturation injtiale pendant 3 minutes d g5°C, puis 35 cycles 
consistant en 1 minute d dS'C, 1 minute d SS'C et 1 minute d YZ'C, 
suivie par une extension finale i Tl'C pendant 3 minutes. 

L'ADN isoie et purifie d partir de Streptosporangium fragile a ete 

IS utilise comme temoin a des concentrations allant de 100 fg d 100 ng. 

Afin d'amplifier specifiquement I'ADN de ce genre bacterien, on 
a choisi les amorces FGPS122 et FGPS350 (tableau 2), 
complementaires ^ une partie de I'ADNr 16S, apres alignement des 
sequences d'ADNr 16S d'actynomycetes. Leur sp6cificite a ete test6e 

20 sur une collection de souches d'actynomycetes {Streptomyc^s, 
Streptosporangium et d'autres genres fortement apparentes). 

Les produits de PCR ont ete hybrides avec la sonde 
oligonucieotidique FGPS643 (tableau 2). Afin de simuler le niveau de 
purete obtenu en routine avec de I'ADN extrait d partir du sol, des 

25 temoins d'ADN pur de 5. fragile ont ete melanges avec les extraits de sol 
obtenus apres des traitements selon les protocoles de lyse 4b et 5b puis 
purifies selon le protocole D. 

Avant utilisation, les extraits de sol ont ete traites avec de la 
DNase (une unite de DNase/ml, GIBCO BRL) pendant 30 minutes a 

30 temperature ambiante. La DNase a ensuite ete inactiv6e par chauffage S 
65°C pendant 10 minutes. Une verification de I'inactivation a ete realisee 
par PCR. Les concentrations d'actdes humiques ont ete mesurees par 
spectrophotometrie (DOasonm) centre une courbe standard d'acides 
humiques commerciaux (Sigma). 
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Des solutions de sol tralt^es d la Dnase non dilutes, diluees 
10x et dilutes x 100 ont 6td melanges de 100. fg d lOOng d'ADN de S. 
fragile avant rampiification par PGR. Dans une autre sSrie 
d'expSrlences, las concentrations croissantes d'ADN de Streptomyces 
5 hygroscopicus de (100 pg d 1 pg) ont 6t6 ajout§es d I'ADN de S. fragile 
afin de simuler la presence d'ADN non-clble et son influence sur le 
proc6d6 PGR. 

1.12 PURIFICATION DES EXTRAITS D'ADN BRUT: Quatre m6thodes 
10 de purification d'ADN ont et^ compar§es. L'ADN a §t§ extrait d partir de 
1g (poids sec de sol selon le protocole 4a et remis en suspension dans 
100 pi de tampon TE8 (50 mM Tris, 20 mM (EDTA. pH 8,0). 

Protocole A 

15 

Elution d travers deux colonnes successives Elutip d 
(SGHLEICHER et SGHUELL, Dassel, Allemagne) (PICARD et al., 
(1992)). 

20 Protocole B: 

Elution a travers une colonne SEPHACRYL S200 (Pharmacia 
Biotech, Uppsala, Suede) suivie d'une Elution ^ travers une colonne 
Elutip d (NESME et al. (1995)). 

25 

Protocole C: 

Separation d I'aide d'un syst^me aqueux a deux phases avec 
17,9% (poids/poids) de PEG 8000 (Merely, Darmstadt, Allemagne) et 
30 14,3% (poids/poids) de (NH4)2S04(ZASLAVSKY,(1995)). 

Apr6s un melange vigoureux au vortex, les deux phases ont 6t6 
Iaiss6es d temperature ambiante pour leur separation. 

1 ml de chacune des phases a 6t6 transf6re dans un autre 
tube, melange avec lOOpI de rechantillon et laisse d 4''C pendant une 
35 nuit pour pemiettre la separation. 
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La phase infSrieure a §t6 diaiys^e pendant une heure d travers 
une membrane Millipore en pr6sence d'un exc6s d'un tampon TE 7,5 (10 
mM Tris, 1 mM EDTA S pH 7,5 et 1 M Mg CI2) afin d'6llminer les sels en 
exc^s. 

5 

Protocole D: 

Elution d travers une colonne de type Microspin Sephacryl 
S400 HR (Pharmacia Biotech, Uppsala, Su6de) , suivie d'une 6lution d 
10 travers une colonne de type Elutip d. 

Chaque protocole est tennin§ par une 6tape de precipitation d 
I'ethanol, et I'ADN est remis en suspension dans 10 pi de tampon TE 
7,5. L'efficacite des protocoles de purification a §{e vSrifi§e par 
amplification PGR de fractions altquotes non dilutes des solutions d'ADN 
15 et de fractions aliquotes dilutes 10 et x 100 fois, en utilisant des 
protocoles standard (voir ci-dessous). 

1.13 RECUPERATION DE L'ADN A PARTIR DE MICROORGANISMES 
INNOCULES: 

20 Les cellules, spores et hyphae ont 6te Iav6es deux fois et denombrees 
par comptage sur plaque ou comptage mlcroscopique direct. Des lots de 
5g de sol sec et tarnish (sols n°2, 3 et 5) ont §t6 inocul^s avec 100 pi 
d'une suspension de spores et d'hyphae de S. lividans ^ des 
concentrations correspohdant a 0,10^, 10^, 10^ et 10^ spores/g de poids 

25 sec de sol, ou avec des cellules v6g6tatlves de B.anthracis d des 
concentrations correspondant d 0,10^ et 10° cellules par gramme de 
poids sec du sol. 

Les quantites de hyphae de S. lividans ont ete calculees sur la 
base du nombre de spores desquelles elles sont originaires. Apres 

30 addition des suspensions bact^riennes, les echantillons de sol sont 
m6lang6s vigoureusement par vortex pendant 5 minutes avant broyage. 
L'ADN est extrait selon le protocole n'S (voir ci-dessous). 

L'amplification PGR suivie d'une hybridation sur tache (Dot Blot) 
et imagerie par phosphorescence (phospho-imaging) a ^te utilisee afin 
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de quantifier les quantites d'ADN recup^rees a partir des cellules, des 
spores et du mycelium bact^rien inocul^ dans les sols. 

L'extraction d'ADN a 6t6 r^alis^e selon le protocole de lyse n°6. 
L'ampliflcatlon PGR et I'hybrldation ont 6t6 realisSes comme d§crit ci- 
5 dessus. Les amorces et les sondes sont clbl^es sur des regions 
chromosomiques localls§es en dehors de la region 16S, et sont 
hautement sp§clfiques des organismes respectlfs, de manldre d §viter 
des signaux de bruit de fond. 

Pour les sols ensemences avec B. anthracis, les amorces R499 
10 et R500 ont §t§ utilisees (Patra et al. (1996)) et les produits 
d'amplification ont hybridSs avec la sonde oligonucl^otidique C501 
(tableau 2). 

Pour les sols ensemences avec S. lividans , les reactions PGR 
ont 6t6 r^aiis^es en utilisant les amorces FGPS516 et FGPS517, et les 
IS produits d'amplification ont 6te hybridSs avec la sonde oligonucldotidique 
FGPS518 (tableau 2). 

La r^ion amplifide est une partie de la cassette construite 
sp^cifiquement pour obtenir la souche OS48.3 (GLERG-BARDIN et al., 
non publi6). 

20 Les comptes de calibration ont §t§ dans tous les cas obtenus 

en utilisant I'ADN purifie de Torganisme cible. 

2. RESULTATS 

25 2.1 CHOIX DU TAMPON D'EXTRACTION: 

20 sols differents ont utilises afin de detemniner le pH optimal du 
tampon d'extraction d'ADN. Pour tous les sols, le rendement en ADN 
augmente avec les pH croissants du tampon. Le rendement pour cheque 
30 pH (+/- sd), calcule comme le pourcentage de la valeur la plus haute 
pour chaoun des sols, est le suivant: pH 6,0 : 31 +/- 13; pH 7,0: 43 +/- 
16; pH 8,0: 60 +/- 14; pH 9,0: 82 +/- 12; pH 10,0: 98 +/- 3. 

Pour 16 des 20 sols, le rendement le plus elev^ a 6t§ obtenu d 
3S pH 10,0, alors que pour les quatre autres sols le plus haut rendement a 
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6t6 obtenu d pH 9,0. Cependant, ^ pH 10,0, des quantites plus grandes 
de materiel humique ont 6t6 Iib6r§es, comparees d pH 9,0 (rSsultats non 
pr6sent6s). En consequence, le pH 9,0 a 6te choisi pour toutes les 
experiences presentees ci-dessous. 

5 

2.2 EFFICACITE DES PROTOCOLES D'EXTRACTION D'ADN: 

L'ADN total des organismes indigenes du sol a 6t6 extrait et quantifi^ de 
mani6re S 6valuer Tefficaclte de nombreux protocoles de lyse cellulaire 
10 in situ. Des ^chantlllons des sols 1-6 (tableau 1) ont et6 traites selon les 
protocoles n'l k 5 dScrits dans la section Materiel et M^thodes (figure 
1). 

Apr^s I'extraction d'ADN, les suspensions de sols ont ^tS 
pr^cipitees avec de i'isopropanol, et des fractions aliquotes des culots 
15 remis en suspension ont 6t6 analys^es par 6lectrophor6se sur gel , dans 
une premiere Stape, afin d'estimer la quality et la quantity de I'ADN 

llb§r§. 

Cependant. la couleur de I'extrait d'ADN devenait de plus en 
plus sombre au fur et d mesure du nombre croissant d'Stapes de lyse, 
20 du fait de la co-extraction de composes, tels que les acides humlques, 
avec I'ADN. 

Certains de ces extraits bruts de couleur sombre ne migrent 
pas de la mani^re attendue dans les gels d'agarose. 

En consequence, les solutions d'ADN brut ont purifi^es 
25 (protocole B) avant quantification. Les electrophoreses sur gel des 
solutions purifiees obtenues apr^s les diff^rents traitements de lyse sont 
exemplifi6es sur le sol n°3 (figure 2). 

Une comparaison visuelle au rayonnement ultra-violet des 
Intensites de I'ADN colore a permis une estimation semi-quantitative de 
30 I'efficacite des traitements. De plus, la presence de profils de migration 
de tallies multiples de fragments (bandes discretes) d'ADN et la 
disparition des fragments longs indique qu'une degradation de I'ADN a 
eu lieu. 

Aucun ADN n'a pu etre extrait du sol argileux n°5. 
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Une quantification plus precise de I'ADN de tous les sols, extrait 
selon les protocoles n°1 d 5, a 6te r^aiisSe par hybridation sur tache (Dot 
Blot) sans ^tape d'ampliflcation PGR pr^alable et en utilisant une sonde 
oligonuciSotidique complSmentalre d'une sequence hautement 
5 conserv6e de la region d'ADNr 16S (sonde FGPS 431 , tableau 2). 

L'ADN a et§ d6tect6 dans les extraits de tous les sols aprSs 
chacune des diff6rentes 6tapes de lyse, d i'exoeption du sol argileux n''5. 

Les resultats concordent avec les estimations r6alis§es apr6s 
gel d'6lectrophordse. 
10 Afin de comparer avec une m6thode inddpendante pour la 

quantification, I'ADN extrait selon le protocole n"! (tous les sols sauf le 
sol n'^S) a §t6 ^galement quantifi6 en utilisant une mSthode 
colorim^trique de detection de I'ADN (RICHARD, 1974). 

On a trouv§ une bonne correlation (r = 0,88) entre I'ADN 
IS quantifi§ en utilisant cette technique col6rim6trique et les r6sultats 
obtenus par hybridation de type Dot Blot/radio-imagerie, conflnfnant 
rhyjaothdse selon laquelie le nombre de copies moyen des bactSrIes du 
sol (rrn) est de 7. 

L'hybridation (Dot Blot) a montr6 que les quantit6s d'ADN 
20 extracellulaires, comme d6termin§ par extraction sans traitement de lyse 
(protocole n'l), allait de 4Mg/g pour le sol acide (n''6) d 36 pg/g pour le 
sol n'Z (tableau 3). 

Le broyage du sol (protocole n*'2 ) a augments les quantit^s 
d'ADN extrait d partir de tous les sols (p.ex. 26 pg/g de sol) pour le sol 
25 n'6 et 59 pg/g de sol (pour le sol n'3) (tableau 3; figure 2). 

Pour les deux traitements de broyage (voir la section Materiel et 
MSthodes) la migration discrete d'ADN a et§ dStectSe sur les gels 
d'agarose, indiquant que les mol6cules d'ADN ont 6t6 partiellement 
d6grad6es (figure 2). 
30 La tallle des fragments d'ADN est comprise entre 20 et 0,2 kb. 

L'intensite de bande des fragments les plus petits est trSs faible, 
indiquant que la majeure partie des fragments ont une taille bien 
supSrieure d 1 kb. 

Le protocole n'*3 comprend une 6tape d'homog6n6isation dans 
35 un dispositif mixeur de type Ultraturax apr&s I'addition du tampon 



wo 01/40497 



77 



PCT/FROO/03311 



d'extraction aux 6chantillons de sol. Cette 6tape conduit S une 
augmentation des quantit^s d'ADN extrait, comme d^termind par 
hybridation sur tache (Dot Blot) pour deux des sols (le terreau 
sablonneux n'Z et le sol acide n'Q), alors que les deux sols riches en 
s mati^re organlque (sols nM et n°2) ont conduit d I'obtention de quantitSs 
plus faibles d'ADN. 

Les protocoles n''4a et n°4b ont permis d'^valuer I'infiuence de 
deux types de sonication sur les rendements en ADN ^ partir de sols 
prdalablement broySs et homogSn^is^s . 

10 La sonication n'a pas eu d'effet positif sur le rendement en 

ADN, compar6 au protocole n°3, except6 pour le sol n'S. Toutefois, 
I'efficacite de lyse des deux types de sonicateur different. Pour les sols 
n'Z, 3 et 4, les quantltSs d'ADN extraits les plus grandes ont 6t§ 
obtenues en utilisant ia micropointe de titane (tableau 3; figure 2), alors 

IS que pour les sols n'l et n'G. le rendement en ADN 6tait supdrieur en 
utilisant le dispositif Cup Horn. 

Des r^sultats contradictoires ont 6t^ ^galement obtenus lorsque 
Ton a ajoute une 6tape de lyse enzymatique/chimique (protocoles n^Sa 
et 5b) apres I'Stape de sonication: dans certains cas, les quantit^s 

20 d'ADN extraites ont 6t6 plus grandes que celles recup6rees selon les 
protocoles nMa et 4b, alors que dans d'autres cas les rendements 
dtalent moindres (tableau 3). 

2.3 COMPTAGE DIRECT DES MICRO-ORGANISMES: 

25 

Des comptes au microscope du nombre total de cellules bactSriennes 
apr^s coloration d I'acridine orange ont ^t^ r§alis§s pour tous les sols, 
avant et apres broyage. 

Avant broyage, le nombre de bact^ries par gramme de poids 
30 sec du sol ailait de 1,4 x 10* (+/- 0,4) dans le sol tropical n'S S 10 x 10^ 
(+/- 0,7) dans le sol provenant de la Cdte Saint-Andr6 (sol n'S) (tableau 
1). 

Apr^s broyage, les nombres de cellules ont 6t6 respectivement 
de 45, 74, 75, 54, 34 et 75% des valeurs initiates pour les sols n"! d 6. 

35 
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2.4 NUMERATION DES ACTINOMYCETES CULTIVABLES 
APPARTENANT A DIFFERENTS GENRES: 

Une modification dans les populations d'actinomycdtes dans le sol n°3 a 
5 6t6 remarqu^e aprds les differents traitements de lyse (figure 3). 

Par exemple, les colonies de Streptomyces sp. dominalent la 
flora viable d'actinomycetes lorsqu'aucun traitement de lyse n'est 
appliqu6 (protocole n"!), et repr6sentaient 65% du ncmbre total de 
colonies identifi6es. Apr6s broyage, le pourcentage de colonies de 
10 Streptomyces a diminu6 pour atteindre 51%, alors que la proportion de 
colonies appartenant au genre Micmmonospora a augments de 14% d 
41%. 

La lyse chimique/enzymatique (protocoles 5a et 5b) est 
apparue comma particuli^rement efficace pour la lyse des 

IS streptomyc^tes. Lorsque tous les traitements da lyse ont 6t§ appliques, y 
compris une lyse chimique/enzymatique (protocoles 5a at 5b), la 
microflora d'actinomycetes, qui comprenait encore plus de 10° CFU/g de 
sol, 6tait domin6e par les esp6ces appartenant au genre 
Micmmonospora, alors qu'aucune ou tr6s peu de colonies de 

20 Streptomyces ont 6t6 recup6rees. 

Las organismes appartenant aux genres tels que 
Streptosporangium, Actinomadura, Microbispora, Dactilosporangium et 
Actinoplanes sont apparus sur les plaques an faible nombre (2-8% du 
nombra total de colonies identifiSes) apr^s broyage, homog^n^isation 

25 avec le dispositif Ultraturrax, et sonication, mais 6taient g6n§ralamant 
absents lorsque cas traitements ^talent combines avac una lyse 
chimique/enzymatique. 

Le nombre total de bacteries cultivables restant apr^s chaque 
traitement de lyse (protocoles 2 a 5) a §te aussi recherch6 pour le sol 

30 n°4. Les resultats indiquent que ie nombre de bacteries cultivables ne 
d6croTt pas avec I'intensite des traitements de lyse (environ 2 x 10° 
CFU/g de sol dans tous les cas, et 6galement lorsqu'un traitement n'est 
appliqu6, tel que selon le protocole n'l). 

L'obtention de ces faibles valeurs de CFU est probablement 

35 due au fait que du sol sec a utilise et que saulas las bacteries les 
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plus r^sistantes se sont multipli^es sur les plaques. Le nombre 
d'actlnomycdtes formant colonies Stait g^n^ralement plus grand que 
celui des CPU total (toutes les bactSries) du fait qu'une etape de 
germination de spores, comprise dans le protocole de detection des 
s actynomyc6tes, manquait lors du contrdle des bact^ries totales. 

2.5 RECUPERATION DE L'ADN DU PHAGE LAMBDA AJOUTE: 

Le but de ces experiences 6tait d'estimer de quelle maniere des 
10 traitements de lyse successifs pouvaient affecter la recuperation d'ADN 
nu , et si ces traitements successifs de lyse contribuaient d sa 
degradation. 

L'ADN pouvait etre soit une fraction d'ADN extracellulaire 
liberee d partir d'organismes dejd morts, qui peuvent persister dans le 

15 sol pendant des mols (WARD et al., 1990), soit de I'ADN libere ^ partir 
d'organismes lyses facilement pendant les premieres etapes du 
traltement. Afin de slmuler cette situation, de I'ADN de phage lambda 
digere par Hindlll a ete ajoute, a diverses concentrations, aux sols avant 
et apres broyage. En plus du broyage, une combinaison des autres 

20 traitements de lyse a 6te testee, y compris la sonication (dispositif Cup 
Horn, voir protocole nMb) et des chocs thermiques (voir la section 
IVIateriel et Methodes). 

Apres extraction, des fractions aliquotes qui devraient 
theoriquement contenir de 25 d 150 ng d'ADN de phage lambda ont ete 

25 analysees par eiectrophor6se sur gel. Aucun fragment d'ADN specifique 
du phage lambda n'a pu etre obsen/e lorsque I'ADN a ete inocuie dans 
les echantillons de sol prealablement au broyage, independamment de 
la dose ou du type de sol. 

Lorsque I'ADN a et6 ajoute apres broyage, et extrait sans etape 

30 de traltement de lyse additionnelle, les profils specifiques d'ADN de 
phage lambda ont ete detectes dans les extraits de quatre des cinq sols 
testes. 

Dans tous ces cas, une relation directe de cause d effet a ete 
obtenue entre la quantite d'ADN ajoutee et I'intensite des signaux sur les 
35 gels d'agarose. Les intensites des signaux etaient, cependant. 
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inf^rieures aux intensit^s de signaux attendues si on les compare ^ 
celles des standards mol6cuiaires. 

De plus, la bande A 23 kb 6talt absente dans plusieurs cas. 
indiquant que les longs fragments 6talent pr6f6rentlellement adsorb6s 
s aux particules du sol, ou ^talent plus sensibles d la degradation, 
compares aux fragments courts. 

Aucune bande n'a ete detectee dans les 6chantillons de sol 
tropical n''5 qui est caract6rise par une tr6s haute teneur en arglle 
(tableau 1). 

10 Pour une quantification plus precise, la recuperation d'ADN a 

6te detemiinee sur un dispositif d'imagerie par phosphorescence 
(phospho-imager) aprds hybridation en tache (Dot Blot). Selon cette 
technique, I'ADN a 6t6 detect6 dans tous les 6chantillons, y compris 
ceux qui avaient ete inocuies avant broyage, a I'exception du sol n°5 

15 dans lequel aucun ADN n'a pu etre detecte. 

Dans tous les autres sols, la quantite d'ADN extrait augmente 
avec I'augmentation de taille de I'inoculum (figures 4a-d). 

Cependant, les recuperations d'ADN de phage lambda etaient 
faibles. Lorsque le broyage 6tait le seul traitement de lyse applique, les 

20 recuperations etaient comprises entre 0,6 et 5,9% de I'ADN ajoute 
lorsque celui-ci etait ajoute avant broyage, et de 3,6 d 24% de I'ADN 
ajoute lorsque ce dernier etait ajoute apr^s broyage. Les plus hauts 
niveaux de recuperation ont ete obtenus d partir du sol n°2. 

L'eiectrophorese sur gel de flections aliquotes d'echantillons 

25 traites par choc thermique et sonication n'a pemiis d'observer des 
bandes d'ADN dans aucun des echantillons. y compris I'essai dans 
lequel I'ADN avait ete ajoute apres broyage. Les experiences 
d'hybridation en tache (Dot Blot) ont confimrie ces r6sultats. 

Les signaux d'hybridation obtenus d partir de suspensions de 

30 sol qui ont ete trait6es par chocs thermiques et sonication ont ete, tout 
au plus, faibles. 

L'echantillon presentant la plus forte quantite d'ADN (15 pg 
d'ADN/g de poids sec du sol) etait le seul pour lequel le signal obtenu 
etait sensiblement different du niveau du bruit de fond. 
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Aucune diff6rence,( ou de faibles differences) n'a 6te observ6e 
entre les echantillons trait6s par choc thermique et ceux traitfes par chocs 
thermiques et sonlcation, indiquant que les chocs thermiques ont un 
effet pr6judiciable sur I'ADN. Les recuperations les meilleures ont et6 
5 observees pour le sol n'l, qui a la plus forte teneur en matl§re organique 
(tableau 1), alors qu'aucun ADN n'a et6 r6cup6r6 d partir du sol argileux 
n'S; 

Des experiences additionnelles ont 6t6 realisees avec des 
echantillons non broyes de sots nM et n^S, qui ont 6te ensemenc6s avec 
10 20 et 50 M9 d'ADN de phage lambda par gramme de sol. 

Les echantillons ont ete extraits immediatement ou apres une 
periode d'incubation d'une heure d 2B'C, puis les extraits d'ADN ont 6te 
purifies et analyses par eiectrophorese sur gel. 

L'incubation du sol n'4 pendant une heure apres I'inoculation 
IS n'a pas conduit e des profils qualitativement ou quantitativement 
differents de ceux obtenus sans incubation ou de ceux observes 
anterieurement lorsque I'ADN avait ajoute apres broyage. 

Ces resultats Indiquent que la degradation enzymatique par les 
nucleases du sol ne seraient pas impliquee dans le faible taux de 
20 recuperation d'ADN. De plus, I'absence d'6tape de broyage ne permet 
pas une augmentation de la recuperation de I'ADN e partir du sol n'S, 
indiquant que les modifications de structure du sol dOes au broyage 
n'augmentent pas significativement I'adsorption des acides nucieiques 
sur les colloTdes. 

25 

2.6 SATURATION DES SITES D'ADSORPTION AVEC L'ARN: 

La plupart des profils obtenus sur les gels d'agarose ne different pas 
significativement des profils precedents dans lesquels le traitement 
30 d'ARN n'a pas ete effectue. 

Par exemple, aucune bande n'a ete detectee d partir du sol 
riche en argile n'5, independamment des concentrations d'ARN et des 
concentrations d'ADN de phage lambda utilisees. 
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De plus, les bandes sp6cifiques d'ADN de phage lambda 
dlg6r6es par HIndlll restaient indStectables dans le terreau sablonneux 
traite par I'ARN (sol nM) lorsque I'ARN est ajoute avant le broyage. 

L'intenslte des bandes obtenues d partir d'§chantlllons 
5 ensemences avec I'ADN apr6s broyage augmente avec la concentration 
d'ARN, indiquant que le traltement pourralt avoir un effet positif. 

Cependant, les r6sultats apr§s hybridation et analyse par 
imagerie ^ phosphorescence n'ont pas confirm^ les r6sultats de 
l'6lectrophor6se. Par exemple, I'effet positif du traitement d'ARN sur la 
10 recuperation d'ADN d partir du terreau argileux, lorsque I'ADN a 6t6 
ajout6 apr^s broyage, n'apparaTt pas clalrement. 

D'un autre cdt6, un effet positif de I'ARN a 6t6 trouv§ pour le sol 
riche en argile (n'S) lorsque I'ADN a 6t6 ajout§ aprds broyage. 

Bien que les signaux d'hybridation pour les Schantillons 
IS contrdle ne different pas des niveaux de bruit de fond, des quantit^s 
significatives d'ADN ont §te liberies d partir des 6chantillons traites par 
I'ARN, et les signaux ont augments avec la quantity d'ADN ajout§e ainsi 
qu'avec la concentration d'ARN. 

Cependant, mdme pour la plus forte concentration d'ARN (100 
20 mg/g de poids de sol sec) le taux de recuperation n'a jamais depasse 
3%. 

2.7 PURIFICATION DES EXTRAITS BRUTS D'ADN: 

25 Des quatre protocoles testes, la meilleure amplification des extraits 
d'ADN non dilues (1 \i\ d'extrait dans 50 pi de melange PCR) a et6 
observ6e apres I'eiution d travers des colonnes de type Microspin S400 
suivie d'une eiution d travers une colonne de type Elutip d, comme le 
montre Telectrophorese sur gel des produits PCR. 

30 L'ADN purifie par le systeme aqueux double phase (protocole 

C) a donne des quantit6s plus faibles de produits PCR apres 
amplification d partir d'extrait d'ADN non dllu6. 

Aucun produit d'amplification n'a pu §tre obtenu e partir des 
extraits non dilues apres amplification d la suite de la mise en oeuvre 

35 des protocoles A ou B. En consequence, le protocole B (voir section 
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Materiels et Methodes) a utilise pour toutes les experiences dans 
lesquelles les amplifications PGR et/ou les hybridations sur tSche (Dot 
Blot) ont et6 r6alis6es. 

5 2.8 QUANTIFICATION PAR PCR ET HYBRIDATION: 

La premiere 6tape 6tait de determiner si les quantit6s de prodult PCR 
6taient proportionnelles au nombre de mol6cules d'ADN cibles 
initialement pr6sentes dans le tube r6actionnel. De I'ADN de 

10 Streptosporangium fragile a ete utilise comme cible (voir section 
MatSrieis et MSthodes). 

Les amorces utilis§es ont et§ les amorces FGPS122 et 
FGPS350 (tableau 2). L'6lectrophor6se sur gel des produits PCR a 
montr6 que I'intensite de bande augmente avec I'accroissement de la 

15 concentration des cibles. Les produits PCR ont 6t6 hybrid6s avec la 
sonde oligonucteotidique FGPS643 (tableau 2), et les signaux ont 6t6 
quantifies par imagerie par phosphorescence (phospho-imaging). 

On a trouve une bonne correlation (r^= 0,98) entre le 
log[nombre de cibles] et le log[intensit6 du signal d'hybridation]. 

20 On a ensuite recherche si I'efficacite de I'amplification PCR etait 

affectee par les acides humiques et I'ADN non cible. Lorsqu'on I'analyse 
par eiectrophorese sur gel, I'intensite accrue des bandes des produits 
PCR, correspondant aux diff6rentes quantites d'ADN cible, etait 
conservee lorsque ramplification etait realisee avec des solutions d'ADN 

25 auxquelles on avait ajoute des extraits de sol traltes d la DNase. 
contenant des acides humides d des concentrations allant jusqu'^i 8ng 
dans le melange PCR d'un volume de 50 pi. 

Avec 20 ng d'acide humique dans le melange PCR, les bandes 
correspondant aux faibles niveaux d'ADN cible ont disparu, et ^ des 

30 concentrations d'acide humique de 80 ng et a des concentrations 
superieures, aucune bande n'6tait visible . 

Les quantites variees d'ADN cible de S.fragile ont permis de 
foumir les quantites attendues de prodult PCR lorsque, avant 
amplification, I'ADN de S. fragile a ete melange avec de I'ADN de 

35 Streptomyces hygroscopicus et ajoute au melange PCR de 50 \i\ dans 
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une gamme de 100 pg gl Ipg afin de simuler I'ADN non-cible Iib6r6 d 
partir de la microflore du sol. 

2.9 QUANTIFICATION DES ACTINOMYCETES INDIGENE DU SOL 
5 APRES DIFFERENTS TRAITEMENTS DE LYSE: 

On a appliqu6 le protocole de purification D sulvi d'une amplification par 
PGR comme d6crit ci-dessus afin de quantifier les actinomyc6tes 
appartenant au genre Streptosporangium dans le sol n°3 aprds 
10 extraction conform6ment aux protocoles n°1 , 2, 3, 5a et 5b (figure 5). 

Aprfes broyage, (protocole n'l) la quantit6 d'ADN cible 
provenant de cet actinomycdte a 6t§ estim6e par hybridation (Dot Blot) 
et radio-imagerie comme 6tant de 2,5 +/- 1 ,3 ng /g de poids de sol sec. 

Si I'on postule que le contenu en ADN est de 10 fg par cellule, 
15 comme pour Streptomyces (Gladek et al. 1 984), cette valeur correspond 
d approximativement 2.5 x 10** genomes. Des valeurs similaires ont 6t& 
obtenues aprds les autres traitements de lyse (respectivement 2,6 +/-1,1 
et 1,8 +/- 1,3 ng d'ADN/g de sol sec en utilisant respectivement les 
protocoles 3 et 4b). 

20 

2.10 EFFICACITE DE LA RECUPARATION D'ADN A PARTIR DE 
SOLS PREALABLEMENT INOCULES AVEC DES BACTERIES: 

Trois sols (n''2, 3 et 5) ont 6t6 inocutes avec des spores ou des hyphae 
25 de Streptomyces IMdans d diff6rentes concentrations (voir section 
Materiel et Methodes). Les quantit^s de myc6lium ajout^es au sol (figure 
6b) correspondent au nombre de spores inocul6es dans le milieu de 
germination. Approximativement 50% de ces spores ont genn6. Le 
nombre exact de cellules dans les hyphae des spores gennin^es n'a pas 
30 6te determine. En consequence, les quantit6s de spores et de mycelium 
ensemenc6es dans les sols ne sont pas directement comparables. 

Pour chaque echantillon de sol, le protocole d'extraction n^S, la 
m6thode de purification D, et I'amplification PGR combin6e avec 
I'hybridation sur tache (Dot Blot) et I'lmagerie par phosphorescence 
35 (phospho-lmaging) ont 6t6 utilises pour d6nombrer les ADNs cibles 
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sp6clfiques qui avaient 6te Iib6r6s. L'ADN extrait peut 6tre clairement 
distingue du bruit de fond seulement lorsque le nombre de spores 
ajoutees d^passe 10^ pour les sols n'3 et n^S et 10' pour le sol n"2 

(figure 6a). 

5 Lorsque le mycelium est ajout6, 1'ADN extrait peut etre d6tect6 

au-del^ d'une quantite correspondant ^ 10^ spores/g de sol pour les sols 
n°2 et n°3, et au-delii de 10' spores/g pour le sol n°5 (figure b). 

Au-dessus du niveau de detection, le signal d'hybridation 
augmente avec des quantit6s croissantes des cellules inocul6es. 

10 Pour rinoculum de spores, une augmentation de 100 fois dans 

le nombre de cellules ensemenc^es conduit d une augmentation de 
presque 100 du rendement d'ADN. Cette augmentation est clairement 
inf6rleure lorsque les hyphae sont inocul6es, particuliferement dans les 
sols n'l et n-a (figure 6). 

15 Au contraire, les r^sultats obtenus lorsque i'ADN de phage 

lambda a §t6 utilise comme inoculum, I'ADN a ^galement 6t6 rScup^r^ d 
partir du sol riche en argile (n'5) lorsque les cellules bacteriennes ont 6t§ 
utilisees comme Inoculum. Cependant, pour ce dernier aussi, le 
traltement par I'ARN a augments la r6cup6ration d'ADN de 

20 Streptomyces ^ partir de ce sol d la fois pour les spores et le mycelium 
(figure 6). 

Le fait d'ensemencer des sols avec des cellules v6g§tatives de 
Bacillus anthracis a foumi des taux de recuperation similaires d ceux 
obtenus pour Streptomyces. 
2S De plus, les taux de recuperation d'ADN d partir du sol n'^S ont 

augmente apres traltement par I'ARN egalement pour cet inoculum. 

Example 2 : Construction d'une banque d'ADN de faible poids 
moieculaire (<10 kb) k partir d'un sol contamin6 par du lindane : 
30 clonage et expression du gene linA 

Cet exemple decrit la construction d'une librairie d'ADN du sol dans 
E. coli. II pennet de demontrer le clonage et I'expression de genes de 
petite taille issus d'une microflore non cultivable . 

35 
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Le lindane est un pesticide organochlor6, recalcitrant d la 
degradation et persistant dans I'environnennent. En aSrobie, sa 
biod6gradation est catalys6e par une d§hydrochlorinase, ood6e par le 
g6ne linA, penmettant de transformer le lindane en 1,2,4- 

5 trichlorobenz^ne. Le g§ne linA n'a 6te identifie que parmi deux souches 
Isoldes du sol : Sphingomonas paucimobilis, isole au Japon (Seeno et 
Wada 1989, Imai et al 1991, Nagata et al 1993) et Rhodanobacter 
lindaniclasticus isole en France (Thomas a/ 1996, Nalln et al 1999). 
Pourtant le potentiel de degradation du lindane, mis en evidence 

10 par dosage des ions chlorures liber^s et amplification par PGR du gSne 
linA d partir de sols ayant en contact ou non avec du lindane, semble 
§tre r^pandu plus largement dans I'environnement (Biesiekierska- 
Galguen, 1997). 

15 1. Extraction directe d'ADN de sol 

Les sols sees sont broye pendant 10 minutes dans un broyeur d 
force centrifuge Restch 6qulpe 6 billes de tungstene. 10 grammes de sol 
broy6 sont mis en suspension dans 50 ml de tampon TENP pH 9 (Tris 

20 50 mM, EDTA 20 mM, NaC1 100 mM, polyvinylpolypirrolidone 1% w/v), et 
homog§n6is6s au vortex pendant 10 min. 

Apr6s centrifugation de 5 minutes, 4000 g d 4°C. le surnageant 
est pr6clpit6 d I'ac6tate de sodium (3M, pH 5.2) et d I'isopropanol, pour 
Stre repris dans du tampon TE sterile (Tris 10 mM, EDTA 1 mM, pH 8.0). 

25 L'ADN extrait est ensuite purifi6 sur colonne de tamisage mol6culaire 
S400 (Pharmacia) et sur colonne 6changeuse d'ions Elutip d (Schleicher 
et Schuell), selon les instructions des fabricants, puis conserve dans du 
TE. 

2. Construction de la banque d'ADN extrait du sol dans le 
30 vecteur pBluescriDt SK- 

Le vecteur pBluescript SK- et I'ADN extrait du sol sont chacuns 
diger§s par les enzymes H/ndlll et BamHl (Roche), d raison de 10 unites 
d'enzymes pour 1 \ig d'ADN (incubation 2 heures d 37»C). Les ADN sont 
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ensuite Iigu6s par action de la T4 DNA ligase (Roche), une nuit a d 
raison d'une unite d'enzyme pour 300 ng d'ADN (environ 200 ng d'ADN 
insert et 100 ng de vecteur dlg6r§). Les cellules d' Escherichia coli 
6lectrocomp6tentes, ElectroMAX DH10B ™ (Gibco BRL) sont 
5 transfonn6es par le m6!ange de ligation (2 pi) par 6lectroporation (25 pF, 
200 et 500 Q, 2.5 kV) (Biorad Gene Pulser). 

Apres une heure d'incubation dans le milieu LB, les cellules 
transformdes sont dilutes de fa^on d obtenir environ 100 colonies par 

10 boTte puis sont ^talees sur milieu LB (10 g/l Tryptone, 5 g/l extrait de 
levure, 5 g/ NaCI) addltionn6 d'Ampiciline (100 mg/l), de y-HCH (500 
mg/l), de X-gal 60 mg/l (5-bromo-4-chloro-3-indolyl-a-D-galactoside), et 
d'IPTG 40 mg/l (isopropylthio-p-D-galactoside), et incub6es une nuit d 
37"'C. Le y-hexachlorocyclohexane (Merck-Schuchardt) 6tant insoluble 

15 dans I'eau, une solution d 50 g/l est preparee dans du DMSO (dimethyl 
sulfoxyde) (Sigma). 

Une banque de 10 000 clones a ainsi 6t6 obtenue. 

3.Clonaae et expression du adne linA 

20 

Le criblage de la banque s'effectue par visualisation d'un halo de 
degradation du lindane autour de la colonie (le lindane precipitant dans 
les milieux de culture). Sur 10 000 clones cribl6s, 35 pr6sentalent ainsi 
une activity de degradation du lindane. La presence du g6ne linA chez 

25 ces clones a pu etre confirmee par PCR grace d des amorces 
sp6cifiques. d6crites par Thomas et ai (1996). Des digestions r6alis6es 
sur les inserts ainsi que sur les produits d'amplification ont montre des 
profils identiques entre tous les clones cribles et le temoin de reference, 
R. lindaniclasticus. Les clones portant le gfene linA pr6sentaient 

30 egalement un insert de mSme taille (environ 4 kb). 

II ainsi pu Stre d§montr§ que I'ADN du sol pouvait §tre clon^ et 
exprim6 chez un hdte h6t6rologue : E. coli. et que des gdnes issus d'une 
microflore difficilement cultivable pouvaient Stre exprim6s. Des banques 
35 r6alis6es a partir de digestion partielle d'AON extrait du sol par des 
enzymes de restriction teiles que Sau3AI sont done aussi envisageables. 
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EXEMPLE 3: 

Procede de preparation d'une coHeetion d'acides nucl6iaues a 
partir d'un 6chantillon de sol, comprenant une 6tape d'extraction 
5 indirecte de i'ADN. 

1. MATERIEL ETMETHODES. 

1.1 Extraction de la fraction bact6rienne du sol. 

10 

5g de sol sont disperses dans 50 ml de NaCI 0.8% sterile, par 
broyage au Waring Blender pendant 3 x 1 minute, avec refroidissement 
dans la glace entre chaque broyage. les cellules bactSriennes sont alors 
s6parees des partlcules du sol par centrifugation sur un coussin de 

15 densite de Nycodenz (Nycomed Pharma AS, Oslo, Norv6ge). Dans un 
tube^ centrifugation, 11,6 ml d'une solution de Nycodenz de density de 
1.3 g.ml*^ (8g de Nycodenz suspendu dans 10 ml d'eau sterile) sont 
places en dessous de 25 ml de la suspension de sol precedemment 
obtenue. Apr6s centrifugation d 10.000 g dans un rotor d godets mobiles 

20 (rotor TST 28.38, Kontron) pendant 40 minutes d 4°C, I'anneau 
cellulaire, se situant k I'interphase de la phase aqueuse et de la phase 
Nycodenz, est pr^levd, lav§ dans 25 ml d'eau sterile et centrifuge a 
10.000 g pendant 20 minutes. Le culot cellulaire est ensuite repris dans 
une solution Tris 10 mM; EDTA 100 mMn pH 8.0. 

25 Prdalablement d la dispersion du sol au Waring Blender, une 

6tape d'enrichissement du sol dans une solution d'extrait de levure peut 
§tre incluse afin de permettre notamment la germination des spores 
bact6riennes du sol. 5 g de sol sont alors incubes dans 50 ml d'une 
solution sterile de NaCI 0.8% - extrait de levure 6%, pendant 30 minutes 

30 ^ 40°C. L'extrait de levure est 6limin6 par centrifugation A 5000 rpm 
pendant 10 minutes afin d'^viter la fonnation de mousse durant le 
broyage, 

1.2 Use des cellules bact6riennes du sol. 

35 
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- Lyse des cellules en milieu liquide et purincaUon sur gradient 
de chlorure de c6sium. 

Les cellules sont Iys6es dans une solution Tiis 10 mM, EDTA 
100 mM, pH 8.0 contenant 5 mg.ml"^ de lysozyme et 0.5 mg.ml'^ 

5 d'achromopeptldase pendant 1 heure d 37°C . Une solution de lauryl 
sarcosyl (1% final) et de proteinase K (2 mg.ml"^) est ensuite ajout6e et 
incub6e d 37°C pendant 30 minutes. La solution d'ADN est alors purifi6e 
sur un gradient de density de chlomre de c6sium par centrifugation d 35 
000 rpm pendant 36 heures sur un rotor Kontron 65.13. Le gradient de 

10 chlorure de c6slum employ^ est un gradient d Ig/ml de CsCI, possedant 
un Indice de refraction de 1 ,3860 (Sambrook et al. . 1 989). 

- Lyse des cellules apr6s inclusion dans un bloc d'agamse. 
Les cellules sont m6lang6es d un volume 6gal d'agarose d 

1.5% (polds/volume) Seaplaque (Agarose Seaplaque FMC Products. 

15 TEBU, Le Perray en Yvellnes, France), i bas point de fusion et coul6es 
dans un bloc de 100 pi. Les blocs sont ensuite incub§s dans une 
solution de lyse : EDTA 250 mM, saccharose 10.3%, lysozyme 5 mg.ml"^ 
et achromopeptidase 0.5 mg.ml'^ d 37X pendant 3 heures. Les blocs 
sont alors laves dans une solution de Tris 10 mM - EDTA 500 mM et 

20 incub6s une nuit 37°C dans de I'EDTA 500 mM contenant 1 mg.ml"^ de 
proteinase K et du lauryl sarcosyl 1%. Aprds plusieurs lavages dans du 
Tris-EDTA, les blocs sont conserves dans de I'EDTA 500 mM. 

La quality des ADN ainsi extraits est contrdl§e par 
eiectrophorSse en champs pulsus. 

25 La quantity d'ADN extrait a ete &va\u6e sur gei d'eiectrophorSse 

par rapport S une gamme 6talon d'ADN de thymus de veau. 

1.3 Caracterisation moleculaire de I'ADN extrait du sot. 

30 Les ADN extraits du sol sont caracteris§s par hybridation PGR, 

m6thode qui consiste d amplifier dans un premier temps les ADNs S 
I'aide d'amorces situ^es sur des regions universeliement conserv§es du 
gene de I'ARNriaS. puis e.hybrider les ADNs amplifies avec diff6rentes 
sondes oligonucieotidiques de specificite connue (tableau 4), dans le but 
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de quantifier I'intensite du signal d'hybridatlon par rapport d une gamme 
^talon externe d'ADN g^nomique. 

Les ADN extraits du sol ainsi que les ADN g6nomiques extraits 
de cultures pures sont amplifies avec les amorces FGPS 612-669 
5 (tableau 1) dans les conditions standard d'amplification par PGR. Les 
produits d'amplification sont ensuite d6natur6s par un volume 6gal de 
NaOH 1N. d6pos6s sur une membrane de Nylon (GeneScreen Plus, Life 
Science Products) et hybrides avec une sonde oligonucl6otidlque 
marqu6e d son extr6mit6 par du g^^P ATP par action de la T4 

10 polynucl6otlde kinase. Aprds pr6hybridation de la membrane dans une 
solution de 20 ml contenaht 6 ml de SSC 20X, 1 ml de solution de 
Denhardt, 1 ml de SDS 10% et 5 mg d'ADN h^tSrologue de sperme de 
saumon. les hybridations sont conduites durant une nuit d la temperature 
d^finie par la sonde. Les membranes sont lav^es deux fois dans du SSC 

15 2X pendant 5 minutes d temperature ambiante, puis une fois dans du 
SSC 2X SDS 0,1% et une seconde fois dans du SSC 1X, SDS 0,1% 
pendant 30 minutes d la temp6rature d'hybridatlon. Les signaux 
d'hybridation sont quantifies ^ I'alde du logiciel Molecular Analyst 
(Blorad, Ivry sur Seine, France) et les quantit6s d'ADN sont estlm6es par 

20 interpolation des courbes etalons obtenues d partir des ADN 
g6nomiques. 

2. RESULTATS ET DISCUSSION 

25 2.1 Extraction et Ivse de la fraction bacterlenne du sol. 

La separation des cellules microbiennes des particules du sol, 
pr6alablement ^l I'extraction de I'ADN, est une alternative pr6sentant de 
nombreux avantages par rapport aux m6thodes d'extraction directe de 

30 I'ADN dans le sol. En effet, I'extraction de la fraction microbienne limite 
la contamination de I'extrait d'ADN par de I'ADN extracellulaire pr6sent 
librement dans le sol ou par de I'ADN d'origine eucaryote. Mais surtout, 
I'ADN extrait de la fraction microbienne du sol pr6sente des fragments 
de plus longue taille et une meilleure int6grlt6 que I'ADN extrait par lyse 

35 directe JACOBSON et RASMUSSEN (1992). De plus, la separation des 
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particules de sol permet d'eviter une contamination de I'extrait d'ADN par 
des composes humiques et ph^nollques, composes pouvant. par la 
suite, nuire gravement aux efficaclt^s de clonage. 

Une des 6tapes determinantes pour I'extraction des cellules du 
5 sol est la dispersion de r6chantillon de sol afin de dissocier les cellules 
adh6rant d la surface ou a I'int^rieur des agr6gats de particules de sol. 
Trois cycles de broyage successifs d'une minute chacun pemiettent 
d'obtenir une meilleure efficacit6 d'extraction des cellules ainsi qu'une 
plus grande quantity d'ADN r§cup§r6, par rapport d un unique cycle de 
10 broyage d'une minute 30. 

Le tableau 5 rapporte les efficacit^s d'extraction obtenues 
aprds centrifugation sur gradient de Nycodenz , sur la microflore totale 
viable (d6nombr6e par microscopie apr6s coloration d I'acridine orange), 
sur la microflore totale cultivable (dSnombree sur milieu solide 

15 Trypticase-Soja 10%), et sur la microflore d'actinomyc^tes cultivables 
sur milieu HV agar (apr6s incubation d 40"'C dans une solution d'extrait 
de levure 6% -SDS 0.05% afin de provoquer la gemrilnation des sprores). 
□'autre part, I'ADN extrait a 6t6 quantifi§ soit aprfes une lyse des cellules 
en milieu liquide (sans purification sur gradient de chlorure de cesium) 

20 soit apr6s une lyse des cellules incluses dans un bloc d'agarose (aprds 
digestion de I'agarose par une b-agarase). 

Les rSsultats montrent que plus de 14% de la microflore 
tellurique totale est r6cup6r6 par cette m6thode (soit 2 10* cellules par 
gramme de sol), et que la microflore totale cultivable ne repr^sente qu'd 

25 peine 2% de la population microblenne totale. 

O'autre part, la quantite d'ADN extrait des cellules est de 330 
ng par gramme de sol sec. En estimant le contenu d'ADN par cellule 
microbienne du sol entre 1.6 et 2.4 fg, et compte tenu de la quantit6 de 
cellules extraites (2 10° cellules par gramme de sol), on peut estimer que ' 

30 la quasi-totalit6 des cellules ont 6t§ lysees et qu'ainsi la lyse n'apporte 
pas d'important biais a cette approche. 

Les electrophoreses en champs puls6s ont montr6 que I'ADN 
du sol extrait aprfes gradient de Nycodenz et de CsCI pouvait atteindre 
une taille de 150 kb et que la lyse en bloc d'agarose pennettait d'extraire 

35 des fragments sup^rieurs d 600kb. 
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Ces rSsultats confirment I'lnt^rSt de cette approche 
ind^pendante de la culture pour la construction de banques d'ADN de 
renvlronnement, en se pr6sentant comme une alternative aux m6thodes 
directes d'extraction d'ADN. 

5 

2.2 Caracterisatlon moleculaire de I'ADN extralt du sol. 

Le but de la caractSrisation moleculaire de I'ADN extralt du sol 
est d'obtenir des profils repr6sentant les proportions des diff6rents 

10 taxons bact^riens presents dans I'extrait d'ADN. II s'agissait 6galement 
de connaTtre les biais d'extraction induits par la separation pr^alable de 
la reaction cellulaire du sol, en comparaison avec une mSthode 
d'extraction directe faute de visualisation directe de la diversity 
microbienne prSsente dans les sols. En effet, peu d'infomiations ont 6t6 

15 rassemblSes sur I'extraction des cellules sur gradient de Nycodenz en 
fonctlon de leur structure morphologique (diam^tre des cellules, fomies 
filamenteuses ou sporul6es). 

Les methodes jusqu'ici en place §taient bas6es sur des: 

hybridations quantitatives utilisant des sondes 

20 oligonucl^otidiques spdcifiques a diffSrents groupes bact§riens, 
appliques directement d'ADN extrait de I'environnement. 
Malheureusement, cette approche n'est pas trds sensible et ne perniet 
pas de d§tecter des genres ou des groupes taxonomiques presents en 
faible abondance AMANN (1995). 

25 - PCR quantitatives telles que la MPN-PCR (Most Probable 

Number) SYKES et al. (1992) ou la PCR quantitative par competition 
DIVIACCO et al. (1993). Les inconvenients respectifs de chacune de ces 
approches sent (i) la lourdeur d'utilisatlon du fait de la multiplication des 
dilutions et des repetitions qui rend la technique inapproprl6e pour un 

30 grand nombre d'6chantillons ou de couples d'amorces, et (ii) la n6cessit6 
de construire un comp6titeur sp6ciflque d I'ADN cible et n'induisant pas 
de biais dans la competition. 

La methode mise en place seion la pr^sente Invention consiste 
^ amplifier universellement un fragment de 700 pb d I'interieur de la 

35 sequence d'ADNr 16S, & hybrider cet amplifiat avec une sonde 
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oligonucl6otidique de sp^cificite variable (au niveau du r^gne. de I'ordre, 
de la sous classe ou du genre) et d comparer I'intensit^ d'hybridation de 
rSchantlllon par rapport d une gamme 6talon externe. L'ampllflcation 
prSalable d I'hybridation permet de quantifier des genres ou des esp^ces 
5 de micro-organismes peu abondants. De plus, rampllficatlon par des 
amorces universelles permet. lors de rhybridatlon, d'utiliser une large 
s6rie de sondes oligonucl6otidiques. Elle permet de comparer entre eux 
diff6rents modes de lyse (extraction directe ou indirecte) sur des groupes 
taxonomiques bien d^finis. 

10 Les r^sultats sont rassembles dans le tableau 6. 

lis montrent des profils simllaires entre les deux mSthodes 
d'extraction (directe et indirecte). Ainsi, 11 apparatt que I'extraction 
prealable de la fraction microbienne tellurique n'introduit pas de r^els 
biais parmi les taxons testes. La seule difference significative entre les 

IS deux approches d'extraction semblerait Stre la plus grande abondance 
de sequences d'ADNr appartenant aux y protdobactSries dans I'extrait 
par la m6thode d'extraction indirecte. 

De plus, un effet significatif de I'lncubation de r§chantillon de 
sol dans une solution d'extrait de ievure est observe sur les populations 

20 sporul6es du sol (Gram*, bas pourcentage de GC et Actinomyc^tes). 
Cette Stape provoque la genriination des spores, et permet d'une part 
certainement une meilleure recuperation de ce type de cellules et d'autre 
part une plus grande efficacite de la lyse sur des cellules en germination. 
Cette approche permet une analyse semi-quantitative, cibl6e 

25 sur les principaux taxons d§finis a partir de micro-organismes cultiv^s et 
habituellement retrouves dans les sols. Seuls des outils mol6culaires 
pemiettent d'estimer I'importance des dlff6rents taxons, les methodes de 
mise en culture etant trop restrictives et d6pendantes de la sp6cificit6 du 
milieu utilise. 

30 Les r^sultats montrent qu'une grande part de la population 

microbienne n'est pas representee dans les groupes phylogenetiques 
decrits, mettant ainsi en evidence I'existence de nouveaux groupes 
composes de micro-oiganismes non cultives jusqu'a present, ou non 
cultivables. 
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Ainsi. de nouvelles sondes peuvent §tre d6finies S partir de 
sequences d^termin^es d partir d'ADN extrait du sol (nouveaux phylums 
composes de micro-organismes non cultlv6s, LUDWIG et al. (1997) afin 
d'obtenir une image plus exacte de la composition de I'extrait d'ADN. 

Example 4 : - CONSTRUCTION DU COSMIDE POS 7001 
Caracterlstiaues de POS 7001: 

Replicatif chez E. coli 
Integratif chez Streptomyces 

S6lectionnab!e chez £ coli AmpR, HygroR et Streptomyces 

HygroR 

Les propriStSs du cosmide pemiettent d'ins^rer de grands 
fragments d'ADN entre 30 et 40kb. 
II comprend 

1 - Le promoteur inductible tipA de Streptomyces IMdans 

2 - Le syst^me d'integration sp6cifique de rel6ment pSAM2 

3 - Le g6ne de resistance ^ I'hygromycine 
4- le cosmide pWED1, derive de pWED15 

1) - Le promoteur inductible du gene tip A de S. IMdans 

Le gSne tipA code une prot^ine de 19 KD dont la transcription 
est induite par I'antibiotique thiostrepton ou nosiheptide. Le promoteur de 
tipA est bien r&gu\&. Induction en phase exponentielle et en phase 
stationnaire (200X) Murakami T. Holt TG, Thompson CJ. J. Bacteriol 
1989 ;171 :1459-66 

2) - Le gdne de resistance a rhvaromvclne 

- Hygromycine: antiblotlque produit par S. tiygroscopicus 

- Le g6ne de resistance code une phosphotransferase {tiphi) 

- Le gene utilise provient d'une cassette construite par Blondelet et al 
dans laquelle le gene hyg est sous contrdle de son propre promoteur 



wo 01/40497 



95 



PCT/FROO/03311 



et du promoteur plac inductible par I'IPTG Blondelet-Rouault et al ; . 
Gene 1997 ;190:315-7 

3) - Le systeme d'integration site-sp6cifique 

5 

L'§l6ment pSAM2 s'int^gre dans le chromosome par un 
m6canisme d'integration site-specifique. La recombinaison a lieu entre 
deux sequences identiques de 58 pb pr^sentes sur le plasmide (aftP) et 
sur le chromosome (attB). 

10 Le gdne int, situ6 d proximity du site attP. est impllqu^ dans 
rintSgratlon site-sp6cifique de pSAM2, et son produit prSsente des 
similitudes avec ies intSgrases des bacteriophages temp^r^s 
d'enterobact6ries. II a 6t6 d6montr§ qu'un fragment de pSAM2 ne 
contenant que le site d'attachement aftP ainsi que le g^ne int 6tait 

15 capable de s'lnt6grer de la m§me manidre que I'^lgment entler. Voir 
brevet frangais n°88 06638 du 18/05/1988, ainsi que Raynal A et al. Mol 
Microbiol 1998 28 :333-42). 

4) - Construction du cosmide pOSTOOl 

20 

Etape 1/ Le promoteur TipA a 6te isol6 du plasmide pPM927 (Smokvina 
et al. Gene 1990; 94:53-9 ) sur un fragment Hindlll-BamHI de 700 
paires de bases et clon6 dans le vecteur pUC18 (Yannish-Perron et al.. 
1985) diger6 par Hindlll/BamHI 

25 

Etape 2/ Ce fragment Hindlll-BamHI a ult6rieurement §t6 transf6r6 de 
pUC18 A pUC19 (Yannish-Pen-on et al., 1985). 

Etape 3/ Un insert BamHI-BamHI de 1500 paires de bases portant le 
30 g§ne int et le site attP de pSAM2 a 6t6 lsol6 du plasmide pOSintI, 
repr6sente d la Figure 8. (Raynal A et al. Mol Microbiol 1998 28 :333-42) 
et clon6 au site BamHi du vecteur pr6c6dent (pUC19/ripA), dans 
■'orientation permettant de mettre le g^ne int sous contrdie du promoteur 
TipA. 

35 
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Etape 4/ Le site BamHI situd en 5' du g6ne int a 6te supprim6 par 
digestion partielle BamHI puis traitement par I'enzyme Klenow. Un 
fragment Hindlll-BamHI portant TipA-int-attP a ainsi 6t6 isol6 de pUC19 
et transfer6 dans pBR322 HIndlll/BamHI. 

Etape 5/ La cassette Hygromyclne isolee de pHP45miyg (Blondelet- 
Rouault et a!., 1997) sur un fragment Hindlll-Hindlll a 6t§ clon6e au site 
Hindi 1 1 situ6 en amont du promoteur TipA. 

Etape 6/ Le site Hindill situ6 entre la cassette QHyg et le promoteur 
TipA a supprim6 par traitement Klenow aprSs digestion partielle 
Hindill. 

Etape7/ Le plasmide obtenu a Tissue de I'^tape prSc^dente pemnet 
d'isoler un fragmesnt unique Hindlll-BamHI, portant tous les 6I6ments 
QHygn"ipA/int attP, qui a 6t6 clon6 apr6s traitement Klenow au site 
EcoRV du cosmide pWEDl Le cosmlde pWED1, repr6sent6 d la Figure 
9, d6rlve du cosmide pWE15, repr6sent§ S la Figure 10 (Wahl GM, et al. 
. Proc Natl Acad Sci U S A 1987 84:2160-4) par d6l6tlon d'un fragment 
Hpal-Hpal portant le g^ne Neomycine et I'origine SV40. 

Une carte du vecteur pOS 7001 est representee d la Figure 1 1 . 

Exemple 5; Construction de piusieurs cosmides coniuaatifs et 
inteqratifs chez Streotomvces. les vecteur pQSV 303. POSV306 et 
POSV307 

5 .1 Construction du vecteur pOSV303. 

Etant donn6 que I'empaquetage s6lectionne les clones ayant 
une taille sup6rieure a SOkb, seuls 10 d 15% des clones ne contlennent 
pas d'insert, il n'est done pas vraiment n6cessaire d'avoir un syst^me de 
selection des recombinants, ce qui permet de construire un vecteur plus 
petit. 
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Construction; 

Etape 1 : le vecteur pOSVOOl 

Clonage d'un fragment Pstl-PstI de 800 paires de bases portant 
I'origine de transfer! OriT du replicon RK2 (Guiney et al., 1983), dans le 
5 plasmide pUC19 ouvert par Pstl. Cette 6tape de clonage permet 
d'obtenir un vecteur transferable de E. coli S Stmptomyces par 
conjugaison. 

La carte du vecteur pOSV 001 est repr6sent6e a la Figure 17. 

10 Etape 2 : le vecteur pOSV002 

Insertion du marqueur Hygromycine (cassette Qhyg), et 
s§lectlonnable chez Streptomyces, de sorte que le g§ne conf^rant la 
r6sistance d Thygromycine soit transf6r6 en dernier ce qui pennet de 
s'assurer du transfert complet du BAG avec I'insert d'ADN du sol. 

15 Clonage de la cassette Hygromycine isol6e de pHP45Qhyg sur un 

fragment Hindlll-Hindlll portant le gene de resistance d I'Hygromycine.. 
Ce fragment est clone au site Pstl (position 201) du vecteur pOSVOOI. 
Ce site Pstl a et6 choisi, compte tenu du sens du transfert, pour que le 
marqueur Hygro soit le dernier transf§r6 lors de la conjugaison. Les 

20 extr6mit6s Pstl et HIndlll sont rendues compatibles apr6s traitement par 
le fragment Klenow de I'ADN polymerase permettant de g§n6rer des 
"bouts francs". L'orientatlon du fragment nhyg est d6temriin6e en fin de 
construction. 

La carte du vecteur pOSV002 est representee d la Figure 18. 

25 

Etape 3 : le vecteur pOSVOlO 

Le fragment Xbal-Hindlll isol6 du plasmide pOSV002 et 
contenant le marqueur de resistance d I'hygromycine et I'origine de 
transfert est clone dans le plasmide pOSintI digere par Xbal et Hindlll. 
30 L'orientaion des sites est telle que le marqueur hygromycine sera 
toujours transfere en dernier. 

Le plasmide pOSintI, represente d la Figure 8, a ete decrit dans I'article 
de Raynal et al.( Raynal A Qt al. Mol Microbiol 1998 28 :333-42). 

Cette constmction pennet I'expression de I'int6grase chez E. 
35 coli et Chez Streptomyces. 
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Etape 4 : insertion du site " cos " 

Le prlncipe est d'ins6rer un site "cos" dans le plasmide 
pOSVOlO permettant I'empaquetage dans le plasmide pOSVOlO, 
5 repr6sent6 ^ la Figure 12. 

L'obtention du fragment " cos " est representee d la Figure 1 3. 

Ce fragment est obtenu par PGR. A partir d'un fragment portent 
les extr6mites coh6sives (cos) de X (bacteriophage lambda ou cosmide 
pHC79), une amplification par PGR est r§alisee S I'aide des 
10 oligonucleotides con-espondant aux sequences -50/+130 par rapport au 
site cos. Ces oligonucleotides contlennent en outre les sites de 
clonageNsil, compatible Pstl. Xliol, compatible Sail, EcoRV, "bout 
franc ". 

L'addition des sites rares Swal et Pad permet d'isoier et/ou de 
15 cartographier I'insert clone. 

Le fragment PGR est borne par un site Pstl d I'extremite 5' et 
par un site Hindi k I'extremite 3', permettant le clonage dans le vedeur 
pOSVOlO (Figure 12) preiablement diger6 par les enzymes Nsil et 
EcoRV, provoquant la deletion du represseur laclq. 
20 La carte du vecteur pOSV303 est representee sur la Figure 14. 

Le vecteur pOSV303, contient des sites de clonage tels que le site Nsil, . 
compatible Pstl. le site Xhol, compatible Sail ou encore le site EcoRV 
pour l'obtention de " bouts francs 

2S 5.2 Construction du vecteur pOSV306 

Etape 1; Construction du vecteur POSV308. 

Le vecteur pOSV308 a 6t6 construit selon le precede illustre d 
30 la figure 27. Un fragment de 643 pb contenant la region cos a et6 
amplifie d I'aide du couple d'amorces de sequences SEQ ID N°107 et 
SEQ ID N''108 a partir du vecteur cosmide pHc79 decrit par HOHM B 
and COLLINS (1980). 
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Ce fragment nucl6otidique amplifi6 a 6t6 clone directement 
dans le vecteur pGEMT-easy commercialis6 par la Soci6t6 PROMEGA, 
comma lllustrd d la figure 27 afin de produire le vecteur pOSV308. 

s Etape 2: Construction du vecteur pOSV306. 

Le vecteur pOSVOlO a et§ construit comme d6crit l'6tape 3 
de construction du vecteur pOSV303, comme decrit au paragraphe 5.1 
du present exemple. 
10 Le vecteur pOSV1 0 a 6t6 dig6r6 par les enzymes EcoRV et Nsil 

afin d'exciser un fragment de 7874 pb qui a 6\& ultSrieurement purifi§, 
comme cela est illustr^ d la figure 28. 

Puis, le vecteur pOSV308 obtenu d I'^tape 1) ci-dessus a 
soumis d une digestion par les enzymes EcORV et PstI afin d'exciser un 
IS fragment de 61 7 pb, qui a 6t§ ult^rieurement purifi6. 

Puis, le fragment cos de 617 pb obtenu a partir du vecteur 
pOSV308 a etS int^gre par ligation dans le vecteur pOSVIO, afin 
d'obtenir le vecteur pOSV306, comme cela est illustr§ d la figure 28. 

20 5.3 Construction du vecteur pOSV307. 

Le cosmide pOSV307 contient toujours le gene Laclq, afin 
d'am^liorer la stability du cosmide dans Streptomyces, par exemple 
dans la souche SI 7-1 de Streptomyces. 
25 Afin de construire le vecteur pOSV307, on a soumis le vecteur 

pOSVOlO d une digestion par I'enzyme Pvull, pour obtenir un fragment 
de 8761 pb qui a it§ purifiS, puis d§phosphoryle. 

Ensuite, le vecteur pOSV308, tel qu'obtenu comme d6crit d 
I'etape 1) du paragraphe 5,2 ci-dessus, a 6te dig6r6 par I'enzyme EcoRI 
30 afin d'obtenir un fragment de 663 pb, qui a 6te ensuite purifi6 et traite par 
I'enzyme de Klenow. 

Le fragment nucl^otidique ainsi traits a §t6 int^gre dans le 
vecteur pOSVOlO apres ligation afin d'obtenir le vecteur pOSV307, 
comme illustrg S la figure 29. 

33 
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Exemple 6 : - Construction du cosmide replicatif navette £. co//'- 
Streotomvces pQSTOOR. 

Les fragments du plasmide pEI16 (Volff et al., 1996) reprSsentd 
s d la Figure 15 ont §t6 isoISs et traites par Klenow. Ces fragments 

contiennent les sequences n^cessaires d la replication et S la stability 

provenant du plasmide SCP2. 

Ces deux fragment sont insures s6parement dans le site 

EcoRV du cosmide pWED1 conduisant d 2 clones diff6rents. 
10 La cassette Hygromycine isol6e de pHP45Qhyg sur un 

fragment Hindlll-Hindlll a 6t6 clon§e au site Hindlll des cosmides 

pWED1 contenant I'insert ScP2 sous forme de fragments Pstl-EcoRI ou 

Xbal. Elle conf^re une resistance §i I'Hygromycine s^lectlonnable i la 

fois Chez E. co// et chez Streptomyces. 
IS Transfomiation de S. lividans et dStemriination de I'efficacite de 

transfonnation. 

II est appanj que le cosmide contenant I'insert Xbal Stait moins 
stable que celui contenant le fragment PstI EcoRI. C'est done ce dernier 
qui a 6te retenu sous le nom de pOS700R. 
20 La carte du vecteur pOS 700R est representee sur la Figure 16. 

Exemple 7: EfTicacite de transformation des vecteurs int6qratife 
(pOS700»etr6plicatifs 

2S Possibilites 

Rendre la souche de S. lividans reslstante au thiostrepton par 
Integration du plasmide pTOI portent le marqueur de resistance au 
thiostrepton 

Preparation de protoplastes A partir de S. lividans cultivee en 
30 presence de thiostrepton 

Avec le vecteur pOS700l, refficacite de transfomiation est 
d'environ 3000 transfonnants par |jg d'ADN. 

Avec le vecteur pOS700R, I'efficacite de transfomiation est 
d'environ 30 000 transfonnants par pg d'ADN. 
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Exemple 8 ; Construction d'un vecteur BAG inteqratif chez 

Streptomvces et coniugatif 

Caract6ristiaue3: 

5 

R6plicatif chez E coli 

Transferable par conjugaison de E. coli aux Streptomyces 

Integratif chez Streptomyces 

S6lectionnable chez E. coli et Streptomyces 
10 Capable d'insSrer de grands fragments d'ADN ; II faut souligner qu'll est 

n^cessaire de disposer d'ADN du sol dont la taille est comprise entre 

100 et 300kb et non contaTT>in6 par des petits fragments. En effet les 

petits fragments sont trSs pr^f^rentiellement Int6gr6s. 

Dot§ d'un crible pemnettant de selectionner les plasmldes 
15 portant un Insert. Ce crible pennet en Sliminant les vecteurs refermSs sur 

eux m§me et non dlgdr^s de travalller avec un rapport plus 6lev6 entre 

vecteur et DNA d Inserer ce qui pennet d'avoir une meilleure efflcacltS 

de clonage pour constituer des banques. 

20 Construction; 

Etape 1 : ie vecteur pQSVOOl 

Clonage d'un fragment Pstl-PstI de 800 paires de bases portant 
25 rorigine de transfert OrIT du r^plicon RK2 (Guiney et al., 1983), dans Ie 
plasmlde pUC19 ouvert par Pstl. Cette Stape de clonage permet 
d'obtenir un vecteur transferable de E. coli ^ Streptomyces par 
conjugaison. 

La carte du vecteur pOSV 001 est representee d la Figure 17. 

30 

Etape 2 : Ie vecteur pOSV002 

Insertion du marqueur Hygromycine (cassette Qhyg), et 
seiectionnable chez Streptomyces, de sorte que Ie gene conferant la 
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resistance a I'hygromycine soit transf6r6 en dernier ce qui permet de 
s'assurer du transfert complet du BAC avec {'insert d'ADN du sol. 

Clonage de la cassette Hygromycine isolee de pHP45Qhyg sur un 
fragment HIndlll-Hindlli portant le gdne de resistance I'Hygromycine.. 

5 Ce fragment est c!on§ au site PstI (position 201) du vecteur pOSVOOL 
Ce site PstI a 6t6 choisi, compte tenu du sens du transfert, pour que le 
marqueur Hygro soit le dernier transfers lors de la conjugaison. Les 
extremit6s PstI et Hindlll sont rendues compatibles aprds traitement par 
le fragment Klenow de I'ADN polymerase permettant de gen6rer des 

10 "bouts francs". L'orientation du fragment nhyg est detemiin6e en fin de 
construction. 

La carte du vecteur pOSV002 est representee a la Figure 18. 
Etape 3 : le vecteur pOSVOlO 

IS 

Le fragment Xbal-Hindlll isoie du plasmide pOSV002 et 
contenant le marqueur de resistance k I'hygromycine et j'origine de 
transfert est clone dans le plasmide pOSintI digere par Xbal et Hindlll. 
L'orientation des sites est telle que le marqueur hygromycine sera 
20 toujours transfere en demier. 

Le plasmide pOSintI, represente a la Figure 8, a ete decrit 
dans I'article de Raynal et al.( Raynal A et al. Mol Microbiol 1998 28 
:333-42). 

2S Cette construction pennet I'expression de I'integrase chez E. 

coli et chez Streptomyces. 

Etape 4 : le vecteur pOSV014 

30 Addition d'une "cassette" pennettant d ieme de seiectionner 

dans la construction finale les plasmides ayant inseres de I'ADN 
etranger. 

Cette "cassette" porte le gene codant pour le represseur CI du phage X 
et le gene conferant la resistance a la tetracycline. Ce gene porte dans 
35 sa region 5' non codante la sequence cible du represseur. L'insertion 
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d'AON dans le site Hindill situe dans la sequence codante de CI conduit 
^ la non production du rSpresseur et done d I'expression de la resistance 
d la tetracycline. 

Elle est portee par le plasmide pUN99 dScrit dans I'article : Nilsson et al . 
s (Nucleic Acids Res 1 983, 1 1 :801 9-30) 

Un fragment Pvull-Hindlll isol§ de pOSVOlO et contenant les sequences 

Int, attP, Hygro et orlT est clon§ au site MscI de pUN99 . 

La carte du vecteur pOSV014 est representee sur la Figure 19. 

10 Etape 5 : le vecteur pOSV 403. vacteur BAG inteqratif et conjuqatlf 

Cette derniere etape de clonage dans pBAC1 1 (represente d la 
Figure. 20) permet de conferer au plasmide final des caracteristiques de 
BAG (Bacterial Artificial Ghromosome), en particulier I'aptitude e 
IS accepter des inserts d'AON de tres grande taille. 

Le fragment Pstl-PstI du vecteur pOSV014 portent I'ensemble 
des elements et fonctions decrits precedemment est clone dans le 
pasmide pBAGII (pBeloBACH) dig6r6 par Notl. Les extremites sont 
rendues compatibles pat traitement avec I'enzyme de Klenow. 
20 La carte du vecteur pOSV403 est representee sur la Figure 21. Le 
schema de la Figure 21 indique I'orientation retenue. 

Etape 6 ; 

Le vecteur pOSV403 contient les sites Hindill et Nsil. Le site 
25 Nsil est assez rare chez Streptomyces et presente I'avantage d'etre 
compatible avec Pstl. En revanche, le site PstI est frequent chez 
Streptomyces et peut etre utilise pour effectuer des digestions partielles. 

Les clones recombinants portant un insert clone dans le 
represseur CI, et done inactivant ce represseur deviennent resistants e 
30 la tetracycline. Etant donne que les BACs ne sont presents qu'e raison 
d'une copie par cellule, il faut s6lectionner les clones recombinants avec 
une dose plus faible de tetracycline que la dose habituelle de 20 pg/ml, 
par exemple avec une dos.e de 5 pg/ml. Dans ces conditions il n'y a 
aucun bruit de fond. 
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II est aussi possible d'utiliser un syst^me d§veloppe et 
commercialism par la soci6t§ InVitrogen, dans lequel rinsertion d'ADN 
dans le vecteur inactive un inhibiteur de la gyrase dont I'expression est 
toxique pour E. coli. Le fragment est pr6ferentiellement Isold i partir du 
5 vecteur pZErO-2 (http://www.invitrogen.com/). 

Example 9 : Construction d'une banaue de S. alboniaer dans les 2 
cosmldes inteqratif (pOS700n et replicatif fpOS700m 

10 1) - Construction de la Banque 

Pour ^valuer refficacitd du systdme de clonage, la vole de 
biosynthdse de la puromycine de Streptomyces alboniger, a clonde 
dans les deux cosmldes navettes pOS700l et pOS700R. Les g^nes de 
IS la vole de biosynth^e de la puromycine sont port&s par un fragment 
d'ADN BamHi d'environ 15 Kb. 

L'ADN g6nomique de Streptomyces alboniger a 6t6 Isold. 90% de cet 

ADN possdde un poids moldculaire compris entre 20 et 150 Kb. 

ddtermind par diectrophordse en champ pulsd. 
20 Les deux cosmldes ont dtd digdrds par I'enzyme BamHI (site 

unique de clonage). 

Les conditions de digestion partielle BamHI de I'ADN 

genomique ont dtd determinees (50 pg dADN et 12 unites d'enzyme, 5 

minutes de digestion). Aprds verification de la taille par electrophordse 
2S en gel d'agarose, I'ADN partiellement digdrd a dtd introdult dans les 

vecteurs. Dans la ligation, 15 pg d'ADN gdnomique 2 pg du vecteur 

intdgratif ou 5 pg du vecteur rdplicatif ont dtd utilises. 

Cheque mdlange de ligation a 6td utilisd pour rencapsidation in 

vitro de I'ADN dans les tStes de bacteriophage lambda. Les melanges 
30 d'encapsidation (0,5ml) ont ete titrds (Vecteur intdgratif pOSZOOl = 7.5 x 

105 cosmldes/ml, Vecteur r6plicatif= 5x10'* cosmldes/ml). 

Les cosmides ont 6t§ utilises pour transfecter E. coli et gendrer 

ainsi deux banques d'environ 25000 clones resistant d ramplcilline. 

L'ADN de I'ensemble de ces clones a dtd Isold et quantifid. 
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Pour tester les banques. plusieurs clones ont 6t6 choisis, I'ADN 
purifi6 et a dig§r§ par BamHI. afin de verifier la presence et la tallle 
des inserts. Les clones testes contiennent entre 20 et 35 Kb d'insert de 
S. alboniger. 

5 

2) - Identification des clones contenant la voie de blosvnthdse de la 
puromvcine 

Les clones susceptlbles de contenir la voie complete de biosynthdse de 
10 la puromycine ont ^t^ identifies par hybridation avec une sonde 
correspondent au gdne de resistance ^ la puromycine, le g^ne pac de 
1,1 kb. (Lacalle et al. Gene 1989;79, 375-80 ) 

Banque faite dans le Vecteur Inteqratif pOS 7001: 

15 

Panni 2000 clones analyses. 9 clones ont hybrid^ avec la 
sonde et lis contiennent des inserts d'environ 40 l^b. 

Banque fafte dans le Vecteur replicatif pOS 700R; 

20 

Pamni 2000 clones analyses, 12 clones ont hybride avec la sonde; ils 
contiennent des inserts d'environ 40 kb. 

En utilisant les donnSes publi^es par Tercero et al. (J Biol 
25 Chem. 1 996; 271 , 1 579-90), les clones contenant la totality de la voie de 
biosynth^se ont 6te identifies, aprSs hybridation avec des sondes 
appropriees. Certains cosmides integratifs et replicatifs prSsentent aprds 
digestion Clal-EcoRV un fragment de 12360 paires de bases, ce qui 
laisse supposer un insert contenant la totalite de la voie de biosynthese 
30 de la puromycine. 

4^ - Verification de la production de puromvcine par les clones 
r6sistants f Rhdne-Poulenc). 
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a) Materiels et M6thodes 
Souches et conditions de culture : 

5 

Trois clones r^sistants ont 6t§ s^lectionn^s pour verifier la production de 
purbmycine. lis correspondent aux recombinants de S. IMdans 
contenant un insert dans le vecteur int^gratif pOS700l (G 20) ou un 
insert dans le vecteur r^plicatif (G21 et G22). 

10 

Des souches de reference ont et6 utilisees pour s'assurer que les 
milieux de culture utilises pemiettaient cette production. II s'agit de la 
souctie sauvage 5. alboniger ATCC 12461, productrice de puromycine 
et de la souche recombinante S. lividans contenant le cluster compiet de 
IS la puromycine c\on& dans le plasmlde pRCPII (Lacalle et al, 1992, the. 
ElVIBO joumal, 11, 785-792) (G23), 

Les souches sont ensemencSs dans un milieu de culture dont la 



composition est la suivante : 
20 Peptone bacteriologique Organotechnie 5g/lde milieu final 

Extrait de levure Springer 5 

Extrait de viande Liebig 5 

Glucose Prolabo 15 

CaC03 (1) Prolabo 3 

25 NaCI Prolabo 5 

Agar (2) Difco 1 



(1) Les 3g de carbonate sont melanges d 200ml d'eau distill^e puis 
stSrilis^s d part. L'addition se faisant aprds sterilisation. 
30 (2) L'agar est prSalablement.fondu dans 1 00ml d'eau distill6e avant d'§tre 
ajout§ aux autres ingr^ients du milieu 

pH ajust6 d 7,2 avant sterilisation 
sterilisation 25 minutes d 121''C 
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50 pg/l d'hygromycine et 5 pg/l de thiostrepton sont ajoutes au milieu 
aprSs sterilisation de fapon a maintenir une pression de selection des 
clones contenant un insert grSce au gene marqueur present sur le 
vecteur ( le gdne de resistance au tliiostrepton 6tant portd par le 
5 plasmidepRCPII). 

50 ml de milieu de culture llquide, repartls en erlenmeyers de 250 ml, 
sont ensemencSs avec 2 ml de suspension aqueuse de spores et de 
mycelium de chacune des souches. Les cultures sont incub§es pendant 

10 4 jours ^ 28°C avec une agitation de 220 trs/mn.50 ml de milieux de 
production, r^partis en erlenmeyers de 250 ml, sont ensuite ensemenc^s 
avec 2 ml de ces pr^-cultures. Le milieu de production utilise est un 
milieu Industrie! optimist pour la production de pristlnamydne (milieu 
RPR 201). Les cultures sont incubSes d 28''C, avec une agitation de 

IS 220trs/mn. AprSs diff^rents temps d'incubation, un erienmeyer de 
chaque culture est amen6 d pH 1 1 puis extrait par 2 fois 1 volume de 
dichlorom§thane. La phase organique est concentr^e S sec sous 
pression r^duite, puis I'extrait est repris par 10 pi de methanol. 100 pi de 
la solution methanolique sont analyses en CLHP munie d'un d^tecteur d 

20 barrette de diodes dans un syst^me gradient eau-ac§tonitrile 0,05% TFA 
VA/ sur colonne C18 pour la detection de la puromycine. 

b^R6sultat8 

Les analyses HPLC comparatives d partir des cultures des 
25 diffdrentes souches montrent la production de puromycine dans la 
culture de la souche sauvage d partir de 24 h d'incubation. Une 
production, bien que plus faible, est aussi nettement detect^e d partir de 
48 h dans la culture du clone G20 contenant le cosmide pOS700l (figure 
23). La puromycine a ^galement §t6 detects d I'^tat de trace dans le 
30 clone G23 contenant I'op^ron complet codant pour le compose dans le 
plasmide pRCPII. Neanmoins, aucune production n'a 6t6 observ6e 
dans les cultures des clones G21 et G22 contenant le cosmide 
pOS700R. Les r6sultats sont report6s sur la Figure 23. 
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c) Conclusions 

Les r^sultats obtenus permettent de d^montrer Tefficacite du 
5 syst^me de clonage d^veloppe dans le cosmide pOS700l pour exprimer 
Chez un hote h6t6rologue tel que S. lividans une voie de biosynthdse 
complete sous le contrfile de sequences r6gulatrices qui lui sont propres. 
□'autre part, ces donnSes valident ^galement le crlblage des banques 
obtenues sur la base de la resistance des clones ei la puromycine 
10 puisqu'il a conduit d identifier pamni un petit nombre de clones, un 
recombinant capable d'exprimer la voie de biosynth^se associee au 
g§ne de resistance. L'absence de production de puromycine chez les 
autres clones peut probablement s"expliquer par le clonage d'une partie 
seulement de I'opSron contenant le gdne de resistance mais depourvue 
IS de certaines sequences de regulation, transduction ou, transcription 
necessaires d la synthese du compose. 

EXEMPLE 10 : - CLONAGE D'ADN DU SOLDANS DES VECTEURS 
1) - Preparation de I'ADN du sol a doner 

20 

Les differents fragments d'ADN doivent etre purifiees selon leur 
destination : 

Cosmides 

. 25 

La taille des molecules doit §tre comprise entre 30 et 40kb. Or , 
I'ADN extrait du sol est heterogene en taille et comprend des molecules 
atteignant 200 ou 300kb. Afin d'homogeneiser les tallies,- I'ADN est 
casse mecaniquement par passage de la solution e travers une aiguille 
30 de 0,4mm de diametre. Les fragments d'une taille voisine de 30kb ne 
sont pas affectes par ces passages repetes a travers une aiguille et il 
n'est done pas necessaire de faire une separation par la taille surtout 
que I'empaquetage dans les particules eiimine automatiquement les 
inserts courts. 

35 
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BACs 

Preparation de I'ADN 

L'ADN du sol est s^pard par electrophor^se en champ puls§ (type 
5 CHEF) dans des conditions telles que les fragments compris entre 
100 et 300kb sent concentr6s dans une bande d'environ 5mm. Ceci 
est obtenu en r6alisant la migration dans un gel d 0.7% d'agarose 
normal ou 1% d'agarose k bas point de fusion avec un temps de 
pulsation de 100 secondes pendant 20 heures et d une temperature 
10 de ICC. 

R6cup6ration de I'ADN 

Deux m^thodes sont utilisdes, leur choix depend de la taille des 
1 5 molecules que I'on veuf isoler, soit jusqu'd 1 50kb soit au dessus. 

- Jusqu'i 150l<b 

La porosit6 d'un gel d 0.7% d'agarose pemiet la sortie de I'ADN par 
20 6lectroelution ^ condition d'absence totale de bromure d'ethidium. 
Cet ADN est ensuite manipul6 avec des instruments de pipetage d 
orifice agrandi et hydrophobe pour 6viter la fragmentation mfecanique 
des mol^ules. 
-Entre 100 et300kb 

25 

La bande contenant les fragments d'une taille entre 100 et 300kb est 
decouple. Pour la migration un gel d'agarose d 1% et d bas point de 
fusion est utilise. Cette propriety pennet de fondre le gel d une 
temperature supportable pour I'ADN de GB'C et de le dig^rer ensuite 
30 par I'agarase (Agarase commercialisee par la society Boehringer) d 
une temperature de 45°C suivant les prescriptions du fcumisseur. 
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2) - Utilisation des cosmides inteqratifs pOS700t et replicat'fs 
POS700R 

5 Construction par queues poivA polvT 
Principe 

Un vecteur cosmide, ouvert un site de clonage quelconque, est modifie 
aux extr6mit6s 3' en ajoutant un polynucl6otide monotone. D'autre part, 
10 I'ADN d doner est modifi§ aux extr^mitSs 3' en ajoutant un 
polynucleotide monotone pouvant s'apparier au precedent. 

L'association vecteur-fragment d doner se fait par ces polynucleotides et 
la sequence cos du vecteur permet I'empaquetage in vitro de I'ADN dans 
IS des capsides die phage Lamda. 

Pr6paration du vecteur 

Le vecteur utilise est un vecteur autoreplicatif chez E. coli et integratif 
20 Chez Streptomyces. 

Pour E. coli, la selection se fait sur la resistance d I'ampicilline et pour 
Streptomyces, elle se fait sur la resistance d I'hygromydne . 
Le cosmide est ouvert d I'un des 2 sites possibles (BamiHi ou Hindlll) et 
25 les extremites 3' sont rallongees par du polyA avec de la tennlnale 
transferase dans les conditions ou le foumisseur de I'enzyme prevoit 
I'addition de 50 d 100 nudeotldes. 

Preparation de I'ADN ins6rer . 

30 

Les extremites 3' de I'ADN sont rallongees par du polyT avec de la 
terminale transferase dans les conditions foumissant un allongement 
comparable e celui du vedeur. Dans les conditions experimentales 
decrites par le fabricant les queues polyA polyT sont longues de 30 e 70 
35 bases 
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Assemblage des moldcules et encapsidation in vitro . 

Pour I'assemblage des molecules, on melange une molecule de vecteur 
5 pour une molecule d'ADN insert. La concentration de I'ADN en masse 
est de 500 MQ-mrV 

Le melange est encapside et l"efricaclt§ de transfection depend de la 
souche utilisSe comme r^ceptrice et de I'ADN Insere : nulle avec I'ADN 
test et la souche DH5a, Tefficacit^ est comparable pour les souches 
10 SURE et DH10B ; d I'extractlon le rendement en ADN est cependant 
plus 6lev6 avec la souche DH10B. 

Construction par d6phosphorvlation 

IS L'ADN du sol est mis en bouts francs par Elimination des s^uences 3' 
sortantes et remplissage des sequences 5' sortantes. Cette operation est 
faite avec: enzyme de Klenow, T4 polymerase, les 4 nucleotides 
triphosphates. Le vecteur cosmidique est digerE par BamHI, puis traits 
par I'enzyme de Klenow pour le rendre bout franc puis d6phosphoryl6 

20 pour eviter qu'il ne se referme sur lul meme. Apr^s ligation, le melange 
est encapside et transfect§ comme pr6c6demment d6crit. 

3> - Utilisation des pBAC 
Principe . 

25 

Le plasmide pBAC conjugatif et Int6gratif poss^de les sites Hindlll et Nsil 
comme sites de clonage. L'insertion d'une sequence d'ADN d ces sites 
inactive le represseur CI du phage Lambda qui contrdle I'expression du 
g^ne de la resistance d la tetracycline. L'inactivation du represseur rend 
30 done la cellule r^sistante d cet antibiotique (Spg.ml'^). Le clonage d ces 
sites est facilite par la modification du vecteur et la preparation de I'ADN 
k doner. 
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Pr6paration du vecteur. Exemple Hindlll 

Pour que le vecteur ne se referme pas sur lui-m§me, ie site Hind III est 
3 modifi§ : la premiere base (A) est remise en place pour former une 
sequence 5' sortante, qui ne peut pas s'apparier avec ses semblables. 
L'op^ration est effectu^e par I'enzyme de Klenow en presence de dATP. 

Le succds de reparation est v^rifi6 en effectuant une ligation du vecteur 
10 sur lui-mgme avant et apr^s traitement k I'enzyme de Klenow. A quantity 
d'ADN test^ identique, on obtient 3000 clones avant traitement et 60 
aprds traitement. 

Preparation de I'ADN (taille comprise entre 100 et 3001(b). 
IS IMise en bouts francs de I'ADN. 

L'ADN est mis en bouts francs par Elimination des sequences 3' 
sortantes et remplissage des sequences 5' sortantes. Cette 
operation est faites avec : enzyme de Klenow, T4 polymerase, les 4 
20 nucleotides triphosphates. 

Preparation des extremites.Exemple Hindlll 

L'addition de I'ADN sur le vecteur se fait au moyen d'oligo- 

nucl6otides reconnaissant la sequence Hindlll modifi6e du vecteur. 

2S lis contiennent des sites de restriction rares pour pennettre les 
clonages ultSrieurs (Swal ; Noti). cette technique est d^rivEe de celle 
de : Elledge SJ, Mulligan JT, Ramer SW, Spottswood M, Davis RW. 
Proc Natl Acad Sci U S A 1991 Mar 1;88(5):1731-5 
Deux oligonucleotides complEmentaires sont utilises : 

30 Oligo 1 : 5'-GCTTATTTAAATATTAATGCGGCCGCCCGGG-3' 
(SEQ ID N°25) 

Oligo 2 : 5'-CCCGGGCGGCCGCATTAATATTTAAATA-3' (SEQ ID 
N"26) 
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lis sont phosphoryl§s en 5' par la polynucl6otide kinase de T4 en 
presence d'ATP, aprds ieur hybridation. Cette 6tape de 
phosphorylation peut §tre 6limin6e en utilisant les oligo-nucl^otides 
d^jd phosphorylis. 

5 La ligation de cet adaptateur double brin avec i'ADN A insurer dans 
un vecteur est faite par la ligase de T4 en presence d'un tr^s grand 
exc^s d'adaptateur (1000 molecules d'adaptateur pour une molecule 
d'ADN ^ Inserer), en 15 heures d 14°C. 

L'exces d'adaptateur est elinnin6 par 6lectrophor6se sur un gel 
10 d'agarose et les molecules d'int^rSt sont r^cup^r^es du gel par 
hydrolyse de celui-ci par de I'agarase ou par 6lectro6lution. 

Ligation vecteur- ADN . 

La ligation se fait d lA'C sur 15 heures avec 10 molecules de 
IS vecteur pour une molecule d'insert. 

Transformation . 

souche r^ceptrice est la souche DH10B. La transformation se fait 
par 6lectrcporation. Pour exprinfier la resistance a la tetracycline, les 
20 transfomiants sont incub6s ^ 37 'C pendant 1 heure en milieu sans 
antibiotique. La selection des clones se fait par culture pendant une 
nuit . sur milieu g^losS LB additionnS de tetracycline d 5(jg.ml'\ 



25 Exemple 11 : CONJUGAISON CLONE A CLONE ENTRE E. CPU ET 
STREPTOMYCES 

CONJUGAISOW ENTRE E CPU SOUCHE S17.1 CONTENANT PPIW803 ET 
STREPTOUYCES LMDANS TK 21 

30 

Introduction 

II est possible d'effectuer des conjugaisons entre E. co//et Streptomyces 
(Mazodier et al, 1989). L'adaptation de cette m6thode en developpant 
3s une technique dite en gouttie ou I'on melange 10 pi d'une culture de E. 
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coli contenant un vecteur recombinant a une goutte de S. IMdans 
r^cepteur consiste d r^aliser une transfonnation de clone d clone en 
s'assurant qu'd la fin de reparation toute la banque construite dans E. 
coli est introduite dans S. IMdans. Une transfomrtation en vrac amdnerait 
s obligatoirement d une multiplication des clones de Streptom^es 
transfomnants afin d'etre pratiquement sur que la banque dans E. coli est 
corhpl6tement represent6e dans S. lividans. 
De plus cette m^thode est facilement automatisable. 

10 Essais preliminaires 

Conjugaison entre E. coli souche S17.1 contenant le vecteur pOSV303 
etS. lividans TK21. 

Dans ces conditions, on melange 5x10° cellules de £. coli avec 2x10° 
IS spores pr^erm^es de S. lividans dans un volume final de 20 |jl. 

Mise au point de la mdthode 

11 est connu que I'ADN extrait de certains actinomycetes est modifie et de 
20 ce fait ne peut §tre introduit dans certalnes souches de £. coli sans qu'il 
soit restreint. La souche de E. coli DH10B qui accepte ces ADN n'est 
pas capable de transferer S Streptomyces un plasmide ne contenant que 
oriT, et il est done n6cessaire d'en construire une. II faudrait y introduire 
par int^ration dans le chromosome un d6riv6 de RP4 capable de fournir 
2S en trans toutes les fonctions nScessaires pour assurer le transfert des 
clones recombinants contenant I'origine de transfert oriT. 

Example 12 ; Construction d'une banque cosmidique dans E. coli 
et Streptomvces IMdans : Clonaqe de I'ADN du sol 

30 

L'objectif est la construction d'une librairie d'ADN de grande 
taille issue de I'environnement, sans 6tape pr^alable de culture.des 
microorganismes. dans le but d'acceder aux gdnes m^taboliques de 
bact^ries (ou de tout autre organisme) que Ton ne sait pas cultiver dans 
35 des conditions standard de laboratoire. 
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La procedure dScrite a 6te utiiisSe pour gdn^rer une banque 
d'ADN dans Escherichia coti utilisant le cosmide navette E colh-S. 
IMdans pOS700l et de I'ADN extrait et purifi6 de la fraction bact6rienne 

s d'un sol . Cette demlere m^thode pennet d'obtenir de I'ADN d'une 
grande purete et d'une taille moyenne de 40 kb. Aussi, afin d'6viter pour 
ie clonage une digestion partielle de I'ADN extrait, a ^t6 adopt6e une 
strat6gie alternative bas6e sur I'utilisatlon de I'enzyme temriinale 
tranf^rase qui permet d'ajouter des queues de polynucleotides aux 

10 extr^mitSs 3' de I'ADN et du vecteur. 

5 |jg d'ADN ont et6 extraits de 60 mg de sol de " la C6te Saint 
Andre " selon ie protocole decrit ^ I'exemple 3 et trait^s avec de la 
terminale transferase (Pharmacia) pour rallonger les extremites 3' avec 
un polynucleotide monotone (poly T) (Exemple 10). 

15 Le cosmide integratif pOS700l est prepare selon le protocole 

B1, Orsay. Apres une etape classique de purification en presence de 
phenol/chlorofonne, I'ADN et le vecteur sont assembles en meiangeant 
une molecule de vecteur et une molecule d'ADN inser6. Le melange est 
ensuite encapside dans les tetes de bacteriophages lambda (kit 

20 Amersham) qui servant d transfecter E. coli DH10B. Les cellules 
transfectees sont ensuite ensemencees sur milieu LB agar en presence 
d'ampicilline pour selection des recombinants resistants d cet 
antibiotique. 

25 Une banque d'environ 5000 clones d'E. co// resistants d 

rampicilline a ete obtenue. Chaque clone a ete ensemence en milieu 
LBou TB + ampicilline dans un puits de microplaque (96 puits) et 
conserve d -80°C . 

30 La sequence aux sites d'insertions des fragments du sol dans le vecteur, 
pOS700l, gen6r6s pendant la construction de la banque a ete analys6e. 
Pour cela 17 cosmides de la banques ont ete purifie et sequence avec 
une amorce, seq.5' CCGCGAATTCTCATGTTTGACCG 3', qui hybride 
entre les site BamHI et le site de clonage Hindlll presente dans le 

35 vecteur. 
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Les sequences obtenues ont permis d'estimer que la longueur des 
queues homopolym6riques aux points de jonctions est tr6s variable, 
entre 13 et 60 poly-dA/dT. Au-deld des queues, les sequences des 
s fragments du sol ainsi gSnSrSes poss^dent un pourcentage en G-t-C 
entre 53 et 70 %. Des pourcentages si 6leves 6taient inattendus, mais 
des r6sultas similaires ont 6te d6j& report§s sur des preparation brut 
d'ADN d partir de sol (Chatzinotas A, a/.. 1998). 

10 Une strategic de " pooling " de 48 ou 96 clones d 6te utilis^e 

pour I'analyse de la richesse microbienne et m6tabolique. L'ADN 
cosmidique extrait d partir de ces " pools " de clones d ^t^ utilise ensuite 
pour rdaliser des experiences de PGR ou d'hybrldation. 

15 

Example 13 ; Diversite de I'ADN ribosomiaue 16S au sein de I'ADN 
clon6. 

a) Materiels et methodes 

20 Les cosmides de la banque sont extraits a partir de pools de 

clones par lyse alcaline puis sont purifies sur gradient de chlorure de 
c§sium, afin de pr6lever la bande d'ADN cosmidique sous fomie super- 
enroul6e et dans le but d'6liminer tout ADN chromosomique 
Escherichia coli pouvant Interferer dans l'6tude. 

25 Apr^s linearisation des cosmides par action de la nuclease SI 

(50 unites, 30 minutes d 37X), les sequences d'ADNr 16S contenues 
dans les pools de clones sont ampl'ifiees dans les conditions standard 
d'amplification, e partir des amorces universelles 63f (5- 
CAGGCCTAACACATGCAAGTC-3') et 1387r (5'- 

30 GGGCGGWGTGTACAAGGC-3') definies par MARCHESI et al.(1998). 
Les produits d'amplification d'environ 1.5 kilobases sont purifies a partir 
du kit Qiaquik gel extraction (Qiagen) puis directement clones dans le 
vecteur pCR II (Invitrogen) chez Escherichia coli TOP10, selon les 
instnjctions du fabricant. L'insert est alors amplifie d I'aide des amorces 

35 Ml 3 Forward et M13 reverse specifiques au site de clonage du vecteur 
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pCR II. Les prodults d'ampllficatlon de tallle attendue (environ 1,7 kb) 
sont analys6s par RFLP (Restriction Fragment Length Polymorphism) d 
I'alde des enzymes Cfol. Mspl et BstUI (0,1 unlt6s) afin de s6lectionner 
les clones i sequencer. Les profits de restriction obtenus sont s^parSs 
5 sur gel d'agarose Metaphore 2.5% (PMC Products) contenant 0,4 mg de 
bromure d'6thidium par ml. 

Les s6quences d'ADNr 16S sont alors d6tennin§es directement 
en utilisant les produits PCR purifies par le kit " Qiaquick gel extraction " 
^ I'alde des amorces de s^quengage d6finles par Normand (1995). Les 

10 analyses phylog6n6tiques sont obtenues en comparant les sequences 
avec les sequences d'ADNr 16S procaryotes rassembl§es dans la base 
de donn6es Ribosomal Database Project (RDP), version 7,0 MAIDAK et 
al.(1999) grace au programme SIMILARITY MATCH, permettant 
d'obtenir les valeurs de simiiaritS par rapport aux sequences de la base 

IS de donn§es. 

b) R6sultat8 

Pour determiner la diversity phylogen6tique representee dans 
la banque, 47 sequences du gene ARNr16S ont 6t6 isoiees d partir de 
20 pools de 288 clones et ont ete sequencees dans leur quasl-totalit6. Les 
resultats sont rapportes dans le tableau 7. 

L'analyse des sequences par inten-ogations des bases de 
donnees rSveie que la majorite des sequences (>61%) pr^sentent des 

25 pourcentages de similarite ihferieurs ou Sgaux d 95% avec des espSces 
bacteriennes identifiees (tableau 7). Sur les 47 sequences analysSes, 28 
sequences ont pour plus proches voisins des bacteries non cultivees, 
dont les sequences ont ete directement issues d'ADN extrait de 
I'environnement. La majorite de ces sequences presentent par ailleurs 

30 des pourcentages de similarite tres faibles (88-95%), 17 sequences sur 
28 different ainsi de plus de 5% par rapport d leurs voisins les plus 
proches. 

Parmi les sequences pouvant etre classees dans un groupe 
phyietique, une majorite de sequences appartiennent d la sous classe a 
35 des proteobacteries (18 sequences avec un pourcentage de similarite 
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compris entre 89 et 99%). Un second groupe de s6quences est 
repr6sent6 par la sous classe g des prot6obact6ries, comprenant 9 
sequences dont les pourcentages de similarity varlent entre 84 et 99%). 
Les groupes des b-prot6obact6rles, d-prot6obact6ries, finnicutes i bas 
5 G+C% et i haut G+C% comprennenf respectivement 1, 4. 3 et 5 
sequences. Seule une sequence n'a pu §tre classSe au sein des grands 
groupes taxonomiques bacteriens d6flnis : la sequence a22.1(19), son 
plus proche volsin Aerothermobacter marianas (avec une similarity de 
89%) etant lui mSme une souche isol6e de I'environnement marin et non 

10 classifi6e d I'heure actuelle.Enfin, 6 sequences peuvent §tre class6es au 
sein du groupe des AcidobacteriumI Holophaga. Ce groupe pr6sente la 
particularity de n'^tre repr^senty que par deux bactyries cultivyes 
Acidobacterium capsulatum et Holophaga foetida, I'ensemble de ce 
groupe ytant composy par des bactyries dont seui le gyne ARNr16S a 

IS yty dytecty par amplification et clonage d partir d'ADN extralt 
d'ychantillon de I'environnement (princlpalement de sol), Ludwig et al 
(1997). Les faibles valeurs de similarity entre les diffyrentes syquences 
composant ce groupe laisse prysager une grande hytyrogynyity et 
diversity au sein de ce groupe. 

20 L'ensemble des resultats est reprysente sur le tableau 7. 

Ces rysultats montrent que les syquences contenues dans la 
banque cosmidique provlendraient de micro-organismes non seulement 
diversifiys phylogynytiquement mais surtout de micro-organismes 
n'ayant jamais yty isoiys jusqu'd ce jour. 

25 Les rysultats du syquengage des ADN amplifiys ont permis 

d'ytablir un arbre phylogynytlque des organismes prysents dans 
rychantillon de sol dont les syquences caractyrisyes sont originaires. 

L'arbre phylogynytlque reprysenty d la figure 7 a yty ryallsy d 
30 partir de I'alignement des syquences par le logiciel MASE (Faulner et 
Jurak, 1988) etcorrigy par la mythode des 2 paramytres de Kimura 
(1980), et a I'aide de raigorithme Neighbour Joining (Saitou et Nei 1987). 
L'analyse phylogynytlque a pemiis de comparer les syquences ADNr 
16S clonyes dans la banque d'ADN du sol, avec les syquences d'ADNr 
35 16S procaryotes rassembtees dans les bases de donnyes Ribosomal 
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Database Project (RDP), (version 7.0, programme SIMILARITY-MATCH, 
Maidak et al 1999), et dans la base GenBank grdce au logicei BLAST 
2.0(Atschulefa/. 1997). 

5 

Example 14 : Preselection qendtiaue de la banoue pour I'evaluation 
de la richesse mfetaboliaue 

Pour caract6rlser la banque obtenue en temrie de diversite 
10 metabolique et identifier les clones contenant des inserts portant des 
gdnes pouvant §tre impliques dans des voies de biosynthfese, il a 6t6 
d^velopp§ selon i'invention des techniques de criblage g^n^tique bashes 
sur des mSthodes PCR afin de ditecter et d'identifier des g^nes PKS de 
typeL 

15 

1 Souches bacteriennes. plasmldes et conditions de culture 

S. coelicolor ATCC101478, S. ambofaciens NRRL2420, S. 
lactamandurans ATCC27382, S. rimosus ATCC1 09610, B. Subtilis 

20 ATCC6633 et 8. licheniformis THE1856 (collection RPR) ont 6te utilises 
comme sources d'ADN pour les experiences de PCR. S. lividans TK24 
est la souche h6te utilis6e pour le cosmide navette POSI700. 

Pour la preparation d'ADN g6nomique, de suspensions de 
spores, de protoplastes et pour la transformation de S. lividans. on a 

25 suivi les protocoles standard d^crits dans Hopwood et al. ( 1 986). 

Escherichia coli Top10 (INVITROGEN) a 6t6 utilise comme hdte pour le 
clonage des produits PCR et E. coli Sure (STRATAGENE) a ete utilise 
comme hote pour le cosmide navette pOS700l. Les conditions de culture 
de E. coli, la preparation de plasmldes, la digestion de I'ADN. 

30 reiectrophorese sur gel d'agarose ont ete realisees suivant les 
procedures standard (Sambroock ef a/..1996). 



35 



2. Amorces PCR: 

Les couples d'amorces a1-a2 et b1-b2 ont ete definis par 
I'equipe de N. Bamas-Jacques et leur utilisation a ete optimisee pour le 
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criblage de I'ADN des souches pures et de la banque du sol pour la 
recherche de gSnes codant PKSI) 



Tableau 8 : 

5 Amorces PGR homoloques aux qfenes PKSI utili86e8 pour la 

criblage de la banaue. . 



a1 (+) 


5" CCSCAGSAGCGCSTSTTSCTSGA 3' 


a2 (-) 


5' GTSCCSGTSCCGTGSGTSTCSA3' 


b1 


5" CCSCAGSAGCGCSTSCTSCTSGA 3' 


b2 


5' GTSCCSGTSCCGTGSGCCTCSA 3' 



10 Conditions d'amplification : 

Pour la recherche de PKS I d partir de I'ADN de souches pures, 
le melange d'amplification contenait : dans un volume final de 50 pi, 
entre 50 et 150 ng d'ADN g6nomique, 200 pM de dNTP, 5mM de MgCb 

15 final, 7% de DMSO, tampon 1x Appligene, 0,4 pM de chaque primer et 
2,5Ude Taq Polymerase Appligdne. Les conditions d'amplification 
utilises sont : d6naturation d 95'C pendant 2 minutes, hybridation ^ 
65°C pendant 1 minute, 6longation d 72°C pendant 1 minute, pour le 
premier cycle, suivi par 30 cycles oCi la temperature est diminu§e 

20 jusqu'd SSX comme dScrit dans K. Seow et ai, 1997. L'§tape 
d'extension finale s'effectue a 72°C pendant 10 minutes. 

Pour la recherche de PKS I d partir de I'ADN de ia banque, les 
conditions PGR sont les memes que ci-dessus pour le couple a1-a2 en 
25 utilisant entre 100 et 500 ng de cosmide extrait de pools de 48 clones. 
Pour le couple d'amorces b1-b2 , SOOng de cosmides issus de pools de 
96 clones ont §t6 utilises. Le melange d'amplification contenait 200 pM 
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de dNTP, 2,5mM de MgCb final. 7% de DMSO, tampon 1x Quiagen, 0,4 
MM de cheque primer et 2,5U de Taq polymerase Hot-start (Qiagen). Les 
conditions d'amplification utilisSes sont: denaturation 15' d QS-C suivie 
par 30 cycles : 1" de d6naturation i 95°C + 1" d'hybrldation d 65'C pour 
5 le premier cycle et 62'C pour les autres cycles, 1' d'6iongation d 72''C, 
6tape d'extension finale de 10' A 72''C. 

L'identification des clones positifs d partir des pools de 48 ou 96 
clones est effectuSe d partir des r^pliques des microplaques mdres 
correspondantes sur milieu solide ou toute autre m^thode standard de 
10 replication. 

3 Sous-clonaqe et sequencaqe 

Les produits PGR des clones identifies ont ete sequences selon le 

15 protocole suivant : 

Les fragments sont purifies sur gel d'agarose (Gel Extraction Kit 
(Qiagen))et clon6s dans E.coli TOP 10 (Invitrogen) k I'aide du kit TOPO 
TA cloning kit (Invitrogen). L'ADN plasmidique de sous-clones est extrait 
par lyse alcaline sur un Biorobot (Qiagen) et dialys6 durant 2 h sur 

20 membrane VS G,025Mm (Millipore). Les 6chantillons sont s§quenc§s 
avec les amorces Ml 3 " Universal " et " Reverse " sur le s6quenceur ABI 
377 96( PERKIN ELMER). 

4) R6suitats 

25 

Definition et validation des amorces PGR 

Deux regions trfes conservees de PKS du type I d'actinomycdtes, 
comprenant le site actif de I'enzyme, ont 6te cibl^es pour ramplification 
30 de gdnes homologues avec des amorces degendr^es. Ges deux regions 
correspondent aux sequences PQQR(L)(L)LE et VE(A)HGTGT 
respectivement. 

Des amorces (tableau 8) ont et6 test6es avec I'ADN de souches 
35 productrices ou non de macrolldes: Streptomyces coelicolor. 
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Streptomyces ambofaciens. producteur de spiramycine, et 
Saccharopolyspora erythraea, producteur de I'erythromycine. Quelles 
que soient les amorces utilisees, des bandes repr6sentant des 
fragments d'envlron 700 pb et correspondant d la longueur du fragment 
s attendu, ont 6t6 obtenues avec toutes les souches. 

Ces r^sultats dSmontrent la specificity des amorces a et b pour 
les gfenes PKS I de souches productrices ou de gfines silencleux chez 
S. coelicolor. 

Le sSquenfage des produits PGR obtenus avec le couple 
10 d'amorces a1-a2 a permis d'identifier, d partir de la souche S. 
ambofaciens, la s6quence d'un gdne KS d6j^ decrite (Demande de 
brevet europ6en n' EP0791656) comme appartenant d la vole de 
biosynth^se du plant^nolide, pr^curseur macrolidique de la spiramycine, 
et deux sequences jamais d6crites, Stramb 9 et Stramb12, (voir liste 
IS sequences). 

En ce qui concerne, S. erythraea, la m§thode de criblage a 
permis ridentificatlon d'une sequence de KS (sacery17) identique d 
celle du KS du module 1 d6ja publiee dans Genebank (Numero d'acc6s 
20 M63677), codant pour la synthetase 1 (DEBS1) du 6- 
deoxy6rythronolide B. Une autre sequence non correl6e d la voie de 
biosynth^se de I'erythromycine a ete identifiSe et il s'agit de la sequence 
SEQ ID N- 32. 

25 Conclusion 

Une methode pour analyser la presence de genes codant pour les 
PKS du type I par PGR S partir de differents micro-organismes a ete 
mise au point. La structure tres conserv6e du domaine de la keto- 
synthetase du type I a pennis de realiser une methode PGR basee sur 

30 I'utllisation d'amorces deg6ner6es biaisees en GC pour le choix des 
codons. 

Cette approche montre la possibilite d'identifier des genes ou 
clusters impliques dans la voie de biosynthese des polyketides du type I. 
Le clonage de ces g6nes penmet la creation d'une collection qui pouna 
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ensuite ^tre utilises pour construire des hybrides polyketides. Le mgme 
Principe peut §Xre appliqu^ d d'autres classes d'antibiotiques. 

Les r6sultats obtenus ici montrent aussi la presence de g§nes 
pouvant appartenir d des clusters silencieux (SEQ 10 N° 30 d 32). 
5 La presence de clusters silencieux a §t6 dejd documentSe dans 

S. lividans et leurs expressions sont d§clenchees par des r6gulateurs 
specifiques ou pleiotropiques (Horinouchi et al. ;Umeyama et al. 1996) 
Ces resultats suggerent que la d6tection de g6nes appartenant it dgs 
voies dites silencieuses codent en r§alit6 pour des enzymes actives 
10 capable de diriger, en association avec les autres enzymes sp6clfiques 
de la voie. les etapes enzymatiques ndcessaires pour la synth6se des 
metabolites secondaires. 

Criblaqe de la banaue 

IS 

Le criblage a effectu§ dans les conditions dScrites dans la 
section Mat^rieis et M^thodes en utilisant les couples d'amorces 
validSes d partir de souches productrices. 

En presence du couple d'amorces a1-a2 , la taille des produits 
20 PCR obtenus d partir de I'ADN cosmidique extrait de pools de 48 ou 96 
clones etalt d'environ 700 bp, done en accord avec les resultats 
attendus. 

L'intensite des bandes obtenues 6tait variable, mals une seule 
bande d'amplification etait pr^sente pour chaque pool d'ADN cible. 

25 Dans ces conditions, 8 groupes d'AON cible ont 6t6 d^tect^s, 

correspondant d 9 clones positifs aprds d^repllcatlon. 
Le criblage effectu6 avec le second couple d'amorces, b1-b2, a donn6 
des resultats d'amplification moins specifiques puisque de nombreuses 
bandes satellites etaient obsen^^es d c6t6 de la bande de 700 bp. 

30 N6anmoins, 9 groupes d'ADN cible ont 6te d§tect6s, con-espondant d 14 
clones positifs aprds d6replication d partir de ces clones positifs, I'ADN a 
6te extrait pour les etapes de s^quengage et de transformation de .S. 
lividans. 
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Analyse des cosmides 

La digestion des cosmides identifies par PGR avec I'enzyme 
Oral, reconnaissant un site riche en AT, libdre un fragment sup6rieur d 
5 23 kb (figure 22). Ceci suggere que la m6thode PGR cible 
preferentlellement I'ADN du sol contenant un haut pourcentage en G+G. 
Ce r6sultat est la consequence de la d6g6n6rescence des amorces 
utilis6es, bials6es en GC pour le choix des codons. Les inserts, comme 
attendu dans le cas de cosmides, ont une taille sup6rieure d 23 kb, sauf 
10 dans un cas ( clone a9B12), ce qui poun^ait traduire une certaine 
instability des cosmides. D'autre part, pamii tous les clones 
sSlectionn^s, seulement deux d'entre eux, GS.F1 et GS.G11. ont montr^ 
le m§me profil de restriction Indiquant un faible taux de redondance dans 
la banque. 

IS Les cosmides s^lectionn^s ont §t§ transforms dans 

Streptomyces lividans par transformation de protoplastes en presence 
de PEG 1000. L'efficacit^ de transformation varie entre 30 et 1000 
transfonnants par yg d'ADN cosmidique utilise. 

20 S6quencaQe et analyse phvtoa6n6tiaue des genes PKS I du sol 

La mSthode de PGR mise d point sur les souches pures a 6t6 
utilisee comme d6crite sur les cosmides de la banque et 24 clones ont 
ainsi 6t6 identifies. 

25 Les produits de PGR d'environ 700 bp obtenus d partir de I'ADN de deux 
pools (48 clones) et de 8 clones uniques, ont dte clones, aprSs 
purification sur gel d'agarose , et sequences. Gela a permis 
I'identification de 1 1 sequences. 

30 L'alignement des sequences proteiques deduites PKSs I du sol 

avec d'autres PKSs I pr§sentes dans diff6rents micro-organismes 
(figure 24) montre la presence d'une region tr6s conservee qui 
correspond d la region consensus du site active de la b-ketoacyl 
synthetase. 

35 
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L'analyse des sequences obtenues avec la m6thode 
" Codonpreference ' (Gribskov et al., 1984 ; Bibb et ai, 1984) a r6v6l6 la 
presence d'un fort biais dans I'usage des codons riches en G+C dans 
una seule phase de lecture. Las protelnes dedultas salon cetta phase 
5 da lecture montrent une forte similarity avec des KSs du type I connus ( 
programme Blast). En particulier, la similarity entre las sequences de 
KSs du sol et des KSs du cluster de rerythromycine est d'environ 53%. 

Apr6s der6plication d'un pool et identification du clone unique, la 
sequence du produit PGR obtenu a partir de ce clone est identique d 
10 celle du pool ce qui confirme la fiabilltS de la m^thode utilisSe. 

L'analyse de la sequence du produit PGR d'un clone a permis 
I'identiflcation probable de 3 gSnes KSI differents. Une de ces 
sequences (SEQ ID N" 34) a une similarit6 de 98,7% avec la s6quence 
d'un autre pool, sugg6rant qu'elles cedent pour la meme enzyme. Les 
15 deux autres sequences sont differentes mais fortement homologues. 

Ici, il est decrit pour la premiere fois le clonage et I'identification 
dans une banque d'ADN du sol de voies de biosynth^se da metabolites 
secondaires contenant des genes codant des KS du type I. 

Le pourcentage 6lev§ en G+C des sequences du sol suggSre 
20 qu'elles puissent deriver de g6nomes ayant un usage des codons 
similaire d ceux d'actinomycetes. 

M§me si les donndes disponibles dans la littSrature sont r^duites, 
on salt que les g§nes codant des PKS du type I sont tr^s diversifies de 
par leur organisation physique dans le g6nome, la taille et le nombre de 
25 modules contenus dans chaque gdne. 

La presence de plusieurs domaines provenant d'un seul clone est 
une confimiation de leur appartenance a des clusters de polyketides 
assym6triques. Dans un seul cas, deux clones semblent former un 
contigue puisqu'ils partagent la meme sequence pour le domaine KS. 
30 La taille des regions g6netiques impliqu6es dans la synthase des 

PKSI varie entre quelques kb pour la p6nicilline d environ 120 kb pour la 
rapamycine. La dimension des inserts cosmidiques peut done ne pas 
§tre suffisante pour I'expression des clusters les plus complexes. 

Des gdnes codant pour des PKSs I. capables de travailler de 
35 fagon iterative comme les PKS II et de contr6ler la synthase de 
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polyk§tides aromatiques, ont 6te dScrits (Jae-Hyuk et al., 1995). L'^tude 
des clusters des PKSs I du sol pourrait apporter encore des nouveautes 
dans ce domalne. 

5 5. Identification de 6 genes codant des polvk^tidaa 

synthases . 

On poursulvant le criblage de la banque de cosmides selon les 
protocoles d§crits dans le present exempie. les inventeurs ont Identifies 
10 un clone de cosmide contenant un Insert de 34071 pb contenant 
plusieurs cadres ouverts de lecture codant pour des polypeptides du 
type polykStide synthase. 

Plus pr6cis6ment, le cosmide ainsi identifi6 par criblage de la 
banque content six cadres ouverts de lecture codant pour des 
IS polypeptides polyk^tide synthase ou pour des polypeptides fortement 
apparent6s, des peptides synthase non ribosomiques. Une carte 
d6taillee de ce cosmide est representee S la figure 36. 

La sequence nucieotidique complete du cosmide constltue la 
sequence SEQ ID N''113 du listage de sequences. L'insert d'ADN 
20 contenu dans la sequence SEQ ID N"'113 constltue la sequence 
nucieotidique compiementaire (brin - ) de la sequence nucieotidique 
codant pour les diffSrents polyketldes synthases. 

La sequence nucieotldique de {'insert d'ADN contenue dans le 
cosmide de la figure 36 qui comprend les cadres de lecture ouverts 
25 codant pour les polypeptides polyketldes synthases (brin +) est 
schematisee sur la figure 37 et constitue la sequence SEQ ID N°114 du 
listage de sequences. 

De plus, une carte detaillee des differents cadres de lecture 
ouverts contenus dans l'insert d'ADN de ce cosmide est representee d la 
30 figure 37. 

Les caracteristiques des sequences nucieotidlques comprenant 
des cadres ouverts de lecture contenus dans l'insert d'ADN de ce 
cosmide sont detainees ci-apres. 
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S6quence ORF1 

La sequence orf1 comprend un cadre ouvert de lecture partielle 
d'une longueur de 4615 nucleotides. Cette sequence constitue la 
5 sequence SEQ ID N^HS, qui d6bute au nucleotide en position 1 et se 
temnine au nucleotide en position 4615 de la sequence SEQ ID N''114. 

La sequence SEQ ID N'l 15 code pour le polypeptide 0RF1 de 
1537 acides amines, ce polypeptide constituent la sequence SEQ ID 
NMai. 

10 Le polypeptide de sequence SEQ ID NMai est apparente aux 

peptides synthases non rlbosomiques. Ce polypeptide possede un degre 
d'Identite en acides amines de 37% avec le peptide synthase de 
Anabaena sp.90 reference sous le numero d'acces «emb 
CAC01 604.1 » dans la base de donnees Genbank. 

15 

sequence 0RF2 

La sequence nucieotidique orf2 a une longueur de 8301 
nucleotides et constitue la sequence SEQ ID N^lie, qui debute au 
20 nucleotide en position 4633 et se tennine au nucleotide en position 
12933 de la sequence SEQ ID N°114. 

La sequence 0RF2 code pour le peptide 0RF2 d'une longueur 
de 2766 acides amines, ce polypeptide constituant la sequence SEQ ID 
N'122. 

25 Le polypeptide de sequence SEQ ID N''122 possede une 

identite de sequence en acides amines de 41% avec la sequence MtaD 
de Stigmatella aurantiaca referencee sous le num6ro d'acces « gb AAF 
19812.1 y> de la base de donnees GENBANK. 

Le polypeptide 0RF2 constitue une polyketide synthase. 

30 

sequence 0RF3 

La sequence nucieotidique orf3 a une longueur de 5292 
nucleotides et constitue la sequence SEQ ID N°117. La sequence SEQ 
35 ID N'l 17 con-espond e la sequence qui debute au nucleotide en position 
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12936 et qui se termine au nucleotide en position 18227 de la s6quence 
SEQIDN»114. 

La sequence nucl6otidique SEQ ID N'117 code pour le 
polypeptide polyketide synthase 0RF3 de 1763 acrdes amines, ce 
polypeptide constituant la sequence SEQ ID N»123 selon I'invention. 

Le polypeptide 0RF3 de sequence SEQ ID N'123 possdde une 
identity de 42% en acides amines avec la sequence MtaB de Stigmatella 
aurantiaca r§f6renc§e sous le n° d'acc^s « gb AAF 19810.1 » de la base 
de donn§es GENBANK. 

Sequence ORF4 

La sequence nucl6otidique orf4 a une longueur de 6462 
nucleotides et constitue la sequence SEQ ID N''118 selon I'invention. 

La sequence nucteotidique SEQ ID N"118 con-espond d la 
sequence debutant au nucleotide en position 18224 et se temiinant au 
nucleotide en position 24685 de la sequence nucieotidique SEQ ID 
N'114. 

La sequence nucieotidique SEQ ID N'HB code pour le 
polypeptide polyketide synthase 0RF4 de 2153 acides amines, ce 
polypeptide constituant la sequence SEQ ID N°124 selon I'invention. 

Le polypeptide 0RF4 de sequence SEQ ID N''124 possede une 
identite de sequence en acides amines de 46% avec la sequence epoD 
de Sorangium cellulosum referencee sous le n" d'acces «gb 
AAF62883.1 de la base de donnees GENBANK. 

Sequence ORFS 

La sequence nucieotidique orf5 a une longueur de 5088 
nucleotides et constitue la sequence SEQ ID N'l 19 selon I'invention. 

La sequence SEQ ID N'lig correspond d la sequence 
debutant au nucleotide en position 24682 et se terminant au nucleotide 
en position 29769 de la sequence nucieotidique SEQ ID N°114. 
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La s6quence nucleotidique SEQ ID NMIS code pour le 
polypeptide polyk6tide synthase 0RF5 de 1695 acides amines, ce 
polypeptide constituant la sequence SEQ ID N°125 selon I'inventlon. 

Le polypeptide polyketide synthase 0RF5 de sequence SEQ ID 
5 N°1 25 poss6de une identite en acides amines de 43% avec la sequence 
epod de Sorangium ceHulosium reference sous le n' d'acc6s « gb AAF 
62883.1 » de la base de donn^es GENBANK. 

Sequence 0RF6 

10 

La sequence nucldotidlque orfB a une longueur de 4306 
nucleotides, et constltue la sequence SEQ ID NM20 selon I'inventlon. La 
sequence nuclfeotidique SEQ ID N'120 correspond d la sequence 
d6butant au nucleotide en position 29766 et se temiinant au nucleotide 

15 en position 34071 de la sequence SEQ ID ID N°1 14. 

La sequence SEQ ID N''120 contient un cadre ouvert de lecture 
partielle codant pour le polypeptide 0RF6 de 1434 acides amines du 
type polyketide synthase, ce polypeptide constituant la sequence SEQ 
ID N°126 selon I'invention. 

20 Le polypeptide de sequence SEQ ID N°126 possede une 

Identite en acides amines de 43% avec la sequence epoD de Sorangium 
cellulosum r6ferencee sous le numero d'acces « gb AAF 62883.1 » de la 
base de donnees GENBANK. 

2^ EXEMPLE 15: Construc tion de vecteufs navettes de tvoa BAG 
integratifs chez Streotomvces 

Construction de vacteure nave ttes du tvna BAG Intearatifc e» 
conluaatlfs chez Streotomvces 

30 

15.1 Construction du vecteur dIWBD-1 



Le vecteur BAG pMBD-1 a ete obtenu selon les etapes 
suivantes: 
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Etape 1: Le vecteur pOSVOlO a 6te soumis a une digestion 
par les enzymes PsTI et BstZ17l afin d'obtenir un fragment nucl6otldique 
de6.3 kb. 

5 Etape 2; Le vecteur pDNR-1 a 6t6 dig6r6 par les enzymes PstI 

et Pvull afin d'obtenir un fragment nucl6otidique de 4,145 kb. 

Etape 3: Le fragment nucleotidique de 6,3 kb provenant du 
vecteur pOSV017 a 6t6 fusionne par ligation au fragment de 4,15 kb 
10 provenant du vecteur pDNR-1, afin de produire le vecteur pMBD-1. 
comme cela est illustrd d la figure 30. 

15.2 Construction du vecteur pMBD-2 

15 Le vecteur pMBD-2 est un vecteur du type BAG contenant une 

boTte Integrative « (|>c31 Int-fthyg ». 

<|»c31 est un phage temp§r6 ^ spectre d'hdte large dont le site 
d'attachement (attP) est bien localise. Le fragment ()>c31 int est le 
fragment minimal de I'actinophage ^c3^ capable d'induire l'int6gration 
20 d'un plasmide dans le chromosome de Streptomyces Lividans. 

Qhyg est un d6riv6 de I'interposon fi capable de conferer la 
resistance A rhygromlclne chez E.colieX S.Lividans. 

Des vecteurs BAG contenant le systeme d'int6gration (|»c31 sont 
d6crits par SOSIO et al. (2000) et dans la demande PGT n^OS 6734 
23 publiee le 29 D^cembre 1 999. 

Le vecteur BAG pmBD-2 a et6 construit selon les Stapes 
suivantes: 

Etape 1: Construction d'une boTte integrative (|)c31int Qhyg 
dans un plasmide multicopies de E.coli. 
30 On a tout d'abord amplifie le fragment (jicSlint d partir du 

plasmide pOJ436 d I'aide du couple d'amorces suivant: 

- L'amorce EV(t»c31l (SEQ ID N'lOQ) (qui permet d'introduire un 
site EcoRV d I'extr6mite 5" de la sequence (j)c31) et l'amorce BII(j)c31F 
(SEQ ID N'llO) (qui pemiet introduction d'un site BgLII d I'extremite 3' 
3S de la sequence (|)c31 ). 
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Le fragment Qhyg a 6t6 obtenu par digestion d I'aide de 
I'enzyme BamHI du plasmide pHP45 fihyg d6crit par BLONDELET- 
ROUAULT(1997). 

Puis la boTte integrative (|.c31 int-fihyg a 6t6 clon6e dans le 
5 vecteur pMCS5 diger^ par les enzymes Bglll et EcoRV. 

Etape 2: Co nstruction du vecteur dMBD-2. 

Le chromosome artificial bact6rien pBAce3.6 d6crit par 
10 FRENGEN et al. (1999) a et6 digere par I'enzyme Nhel puis trait6 par 
I'enzyme Ec6 polymerase. 

Puis, le vecteur pMCSS (|.c31 int-fihyg a 6t6 dig6r6 par les 
enzymes SnaBI et EcoRV afin de r6cup6rer la boTte integrative. 

La carte detaiiiee du vecteur pMBD2 est representee d la figure 

15 31. 

15.3 Construction du vecteur plVIBD-3. 

Le vecteur pMBD-3 est un vecteur integratif (<|»c31 int) et 
20 conjuguatif (OriT) du type BAG. qui comprend le marqueur de selection 
i2hyg. 

La carte du vecteur pMBD-3 ainsi que son precede de 
construction sont illustres d la figure 31. 

Le vecteur pMBD-3 a ete obtenu en amplifiant le g6ne OrIT d 
25 partir du plasmide pOJ436 i I'aide du couple d'amorces de sequences 
SEQ ID N" 111 et SEQ ID N''112 qui contiennent des sites de restriction 
paci. 

Le fragment nucleotidique amplifie d I'aide des amorces SEQ 
ID N°111 et SEQ ID N'112 a 6te clone dans le vecteur pMBD2 
30 prealablement dlg6r6 par I'enzyme Pad. Le schema de construction du 
vecteur pMBD-3 est illustre d la figure 31. 
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15.4 Construction du vecteur pMBD-4 

La carte d^taill^e du vecteur pMBO-4 est representee d la 
figure 32. 

5 Le vecteur pMBD4 a et6 obtenu en clonant la boTte integrative 

<|>c31 Int-nhyg dans le vecteur pCYTAC2. 

15.5 Construction du vecteur pMBD-5 

10 Le schema de construction du vecteur pMBO-5 est illustre e la 

figure 33. 

Le vecteur pMBD-5 a ete construit par recombinaison du 
fragment nucieotidique compris entre les deux sites loxP du vecteur 
pMBD-1 illustre d la figure 33 avec le site loxp contenu dans le vecteur 
IS SAC designe pBTP3, une carte detailiee du plasmide pBTP3 etant 
representee e la figure 34. 

15.6 Construction du vecteur pMBD-6 

20 Le vecteur pMBD-6 a ete construit en recombinant le fragment 

nucieotidique compris entre les deux sites loxP du vecteur pMBD-1 au 
niveau du site loxP du vecteur BAG pBeloBacH, comme represente sur 
la figure 35. 
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TABLEAU 9 : Sequences 



Designation 


SEQ ID N" 


Sondds ot amorcos 




FGPS431 


1 


FGPS122 


2 


FGPS350 


3 


FGPS643 (T) 


4 


FGPS643 (C) 


5 


R4g9 


6 


R500 


7 


C501 


8 


FGPS516 


9 


FGPS517 


10 


FGPS518 


11 


FGPS612 


12 


FGPS669 


13 


FGPS618 


14 


FGPS614 


15 


FGPS615 


16 


FGPS616 


17 


FGPS621 


18 


FGPS617 


19 


FGPS680 


20 


FGPS619 


21 


63f 


22 


1387r 


23 


Oligo-1 (Exemple 10) 


24 


Oligo-2 (Exemple 10) 


25 


A1 


26 


A2 


27 


B1 


28 


B2 


29 


Acides nucl^lques PKS-i 




Amb9 


30 


Amb12 


31 


Ery19 


32 


Agb12 


33 


A23G1 1-1 


34 


A26G1 1-2 


35 


A26G1-10 


36 
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TABLEAU 9 (suite 1):S6quences 



Designation 


SEQ ID N* 


A35 E4-16 


37 


A49F1-32 


38 


A17d2-3 


39 


A53F11-13 


40 


A53F11-14 


41 


A22A2-11 


42 


A36E8-1 


43 


A52E8-2 


44 


Sequences d'acides amines PKS-i 




Amb9 


45 


Amb12 


46 


Ery19 


47 


A9b12 


48 


A23G1 1-1 


49 


A26G1 1-2 


50 


A26G1-10 


51 


A35 E4-16 


52 


A49F1-32 


53 


A17d2-3 


54 


A53F11-13 


55 


A53F1M4 


56 


A22A2-11 


57 


A36E8-1 


58 


A52E8-2 


59 


Sequences ADNr 163 




a24.1(2), 


60 


a4.a6.a7 (7) 


61 


a52.a53.a5(15) 


62 


a49.a50.a51(11) 


63 


a4.a6.a7(14) 


64 


a30.a31.a32(7) 


65 


a37.a38.a39(6) 


66 


a46.a47.a48(14) 


67 


a49.a50.a51(1) 


68 


a52.a53.a5(8) 


69 


a8.a9.a10(13) 


70 


a1.a2.a3(13) 


71 


a43.a44.a45(10) 


72 


a27.a28.a29(5) 


73 
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TABLEAU 9 (suite 2):Sdquences 



Designation 


SEQ ID N" 


a23.1 


74 


a25.1 


75 


a18.1(22) 


76 


a33.1 


77 


a14.7 


78 


a21.7 


79 


a8.a9.a10(7) 


80 


a8.ag.a10(18) 


81 


a27.a28.a29(3) 


82 


a34.a35.a36(5) 


83 


a22.1(19) 


84 


a11.a12.a13(5) 


85 


a19.a20.a26(9) 


86 


a40.a41.a42(6) 


87 


a27.a28.a29(8) 


88 


a27.a28.a29(12) . 


89 


a37.a38.a39(12) 


90 


a46.a47.a48(6) 


91 


a11.a12.a13(11) 


92 


a15.a16.a17(12) 


93 


a15.a16.a17(5) 


94 


a19.a20.a26(13) 


95 


a37.a38.a39(14) 


96 


a8.a9.a10(9) 


97 


319.820.326(5) 


98 


343.344.345(4) 


99 


a1.a2.a3(4) 


100 


a4.a6.a7(23) 


101 


a49.a50.a51 (22) 


102 


a8.a9.a10(2) 


103 


a34.a35.a36(3) 


104 


334.335.336(10) 


105 


340.a41.a42(13) 


106 
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TABLEAU 9 (suite 3) : 



Sequences 



Designation 


SEQ ID N" 


Amorces 




cos 1 n (example 5) 


107 


cos 2 n (example 5) 


108 


EV(j)c31l (example 15) 


109 


BII(|ic31F (exemple 15) 


110 


Amorce 1 (exemple 15) 


111 


Amorce 2 (exemple 15 


112 


Acides nucleiques PKS-i 




Cosmide a2641 (vecteur + insert brin (-) 


113 


Cosmide a2641 (insert - brin {+) 


114 


orfl 


115 


ottZ 


116 


orf3 


117 


orf4 


118 


orf5 


119 


orf6 


120 


Sequences acides amines PKS-I 




0RF1 


121 


0RF2 


122 


0RF3 


123 


0RF4 


124 


0RF5 


125 


0RF6 


126 
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REVENDICATIQNS 

1. Proc^dS de preparation d'une collection d'addes nucl6iques d partir 
d'un echantilion de sol contenant des organismes, ledit precede comprenant la 

succession d'Stapes suivante : 

- 1 (a) Obtention de micro-particules par broyage d'un 6chantillon de 
sol prealablement s6ch6 ou desslque , puis mise en suspension des 
micro-particules dans un milieu tampon liquide ; et 

(b) extraction des acides nuclSiques presents dans les micro- 
particules ; et 

icy passage de la solution contenant les acides nucl6lques sur un 
tamis molSculaire, puis recuperation des fractions d'^iution enrichies 
en acides nuclSiques et passage des fractions d'eiution enrichies en 
acides nucleiques sur un support de chromatographie d'^change 
d'anions, puis recuperation des fractions d'6lution contenant les 
acides nucleiques purifies. 

2. Precede de preparation d'une collection d'acides nucleiques d partir 
d'un echantilion de I'environnement contenant des organismes, ledit precede 
comprenant la succession d'etapes suivante : 

- 11 (i) Obtention d'une suspension par dispersion de I'ectiantillon de 
I'environnement en milieu liquide puis homogenisatlon de la 
suspension par agitation douce; et 

(ii) separation des organisnries et des autres constituants mineraux 
et/ou organiques de la suspension homogene obtenue d I'etape (i) par 
centrifugation sur un gradient de densite ; et 

(iii) lyse des organismes separes d I'etape (ii) et extraction des acides 
nucleiques; et 

(iv) purification des acides nucleiques sur un gradient de chlorure de 
cesium. 

3. Procede seion la revendication 1, caracterise en ce que I'etape I- 
(a) est suivie d'une etape compiementaire de : 

- traitement des micro-particules en suspension dans un milieu 
tampon liquide par sonication ; 
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4. Proc§d6 selon la revendication 1, caracterisd en ce que i'etape 
l-(a) est suivie des stapes compl6mentaires suivantes : 

- traitement des micro-particules en suspension dans un milieu 
tampon llquide par sonicatlon ; 

- incubation de la suspension d 37°C apr^s sonicatlon en presence de 
lysozyme et d'achromopeptidase; 

- addition de SDS 

- recuperation des acldes nuclSiques. 

5. Proc^dS selon la revendication 1, caract^risd en ce que I'etape I- 
(a) est suivie des Stapes complSmentaires suivantes : 

- homogSnSisation des micro-particules d I'aide d'une Stape de 
mixage violent (vortex) suivie d'une Stape de simple agitation ; 

- congelation de la suspension homogSne suivie d'une dScongSlation ; 

- traitement par sonlcation de la suspension apres dScongSlation ; 

- Incubation de la suspension d 37°C apres sonicatlon en presence de 
lysozyme et d'achromopeptidase; 

- addition de SDS; 

6 .ProcSdS selon I'une des revendications 1^5 caractSrisS en ce 
que les acldes nuclSiques sont des molecules d'ADN. 

7. ProcSdS de preparation d'une collection de vecteurs 
recombinants, caracterise en ce que les acides nucl6lques obtenus par le 
precede selon I'une des revendications 1^6 sont inserts dans un vecteur 
de clonage et/ou d'expression. 

8. Proc6d6 selon la revendication 7, caract6ris6 en ce que les 
acides nucl6iques sont s6par6s en fonction de leur taille pr6alablement d 
leur insertion dans le vecteur de clonage et/ou d'expression. 

9. ProcSde selon la revendication 7, caract6ris§ en ce que la taille 
moyenne des acides nucieiques est rendue sensiblement unifomrie par 
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rupture physique, pr6alablement d leur insertion dans ie vecteur de clonage 
et/ou d'expression. 

10. Proced6 selon la revendication 7, caract6rise en ce que Ie 
vecteur de clonage et/ou d'expression est du type plasmide. 

11. Proc6d6 selon la revendication 7, caract6ris6 en ce que Ie 
vecteur de clonage et/ou d'expression est du type cosmide. 

12. Proc6d6 selon la revendication 11." caract6ris6 en ce qu'il s'agit 
d'un cosmide r6plicatif chez E. coli et int6gratif chez Streptomyces. 

13. Proc6d6 selon la revendication 12, caract6ris6 en ce qu'il s'agit 
du cosmide pOS700l. 

14. Proc6d6 selon la revendication 11, caracterise en ce qu'il s'agit 
d un cosmide conjugatif et int6gratif chez Streptomyces. 

15. Proc6d6 selon la revendication 14. caract6ris6 en ce que Ie 
cosmide est choisi pamii les cosmides pOSV303, pOSV306 et pOSV307. 

16. ProcSdS selon la revendication 11, caracteris§ en ce qu'il s'agit 
d'un cosmide r6plicatif d la fois chez £. co// et chez Streptomyces. 

17. Proc6de selon la revendication 16. caract§ris6 en ce qu'il s'agit 
du cosmide pOS 700R. 

18. Proc6de selon la revendication 11, caract6rise en ce qu'il s'agit 
d'un cosmide r6plicatif chez E. coli et Streptomyces et conjugatif chez 
Streptomyces. 

19. Proc^dS selon la revendication 7, caract6ris§ en ce que Ie 
vecteur de clonage et/ou d'expression est du type BAC. 
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20. Proc6d6 selon la revendication 19, caracterisd en ce qu'ii s'agit 
d'un vecteur BAG int^gratif et conjugatif chez Streptomyces. 

21. Proc6d6 selon la revendication 20, caract6ris6 en ce que le 
vecteur est choisi pamii les vecteurs BAG pOSV403, pMBD-1. pMBD-2, 
pMBD-3, pMBD-4, pMBD-5 et pMBD-6. 

22. Proc6d6 de preparation d'un vecteur recombinant de clonage 
et/ou d'expresslon, caracterlse en ce que I'etape d'Insertion d'un acide 
nucl§ique dans le vecteur de clonage et/ou d'expressjon comprend les 
Stapes suivantes : 

- ouvrir le vecteur de clonage et/ou d'expresslon d un site de clonage 
choisi, S I'aide d'une endonuclease de restriction appropriSe ; 

- ajouter un premier acide nucl6ique homopolym§rique d rextrSmitS 3' 
libre du vecteur ouvert ; 

- ajouter un second adde nucldique homopolymSrique, de sequence 
complSmentaire au premier acide nuclSique homopolym§rique, d 
I'extr^mitS 3' libre de I'acide nucleique de la collection d insurer dans le 

vecteur; 

- assembler raclde nucleique du vecteur et I'acide nucleique de la 
collection par hybridation du premier et du second acide nucleique 
homopolymSrique de sequences complSmentaires I'une de I'autre; 

- refemier le vecteur par ligation. 

23. Proc§d§ selon la revendication 22, caractSrisS en ce que : 

- le premier acide nucleique homopolymSrique est de s^uence poly(A) 
ou poly (T) ; et 

- le second acide nucleique homopolymSrique est de sequence poly(T) 
ou poly(A). 

24. Proc6de de pr6paration d'un vecteur recombinant selon I'une 
des revendications 22 ou 23. caracterisS en ce que la taille de I'acide 
nucleique d insurer est d'au moins 100 kilobases. prSfSrentiellement d'au 
moins 200 kilobases. 
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25. Proc6d6 de pr6paration d'un vecteur recombinant selon I'une 
des revendications 22 d 24, caract6ris6 en ce que Tacide nucl^ique d insurer 
est contenu dans la collection d'acides nucleiques obtenus par le proc^^ 
selon I'une des revendications 1 d 6. 

26. Proc§d§ de preparation d'un vecteur recombinant de clonage 
et/ou d'expression, caract6ris6 en ce que I'^tape d'insertion d'un d'acide 
nucl6ique dans le vecteur de clonage et/ou d'expression comprend les 
etapes suivantes : 

- creation de bouts francs sur les extr^mit^s de I'acide nucl^ique de la 
collection par elimination des sequences 3' sortantes et remplissage 
des sequences 5' sortantes ; 

- ouverture du vecteur de clonage et/ou d'expression d un site de 
clonage choisi, d I'aide d'une endonucl^ase de restriction appropri^e ; 

- creation de bouts francs aux extr§mlt6s de I'acide nucl6ique du 
vecteur par Elimination des sequences 3' sortantes et remplissage des 
sequences 5' sortantes, puis d6phosphorylation des extr6mit§s 5' ; 

- Addition d'adaptateurs oligonucl§otidiques complementaires ; 

^ insertion de I'acide nucleique de la collection dans le vecteur par 
ligation. 

27. Proced6 de preparation d'un vecteur recombinant selon la 
revendication 26, caract6ris§ en ce que la taille de I'acide nucleique a inserer 
est d'au moins 100 kilobases, pr6f6rentiellement d'au moins 200 kilobases. 

28. Proc6d6 de pr6paration d'un vecteur recombinant selon I'une 
des revendications 26 ou 27, caracterisE en ce que I'acide nucleique d 
inserer est contenu dans la collection d'acides nucleiques obtenus par le 
proc6d§ selon I'une des revendications 1 d 6. 

29. Proc6d6 selon I'une des revendications 22 d 28, caracteris§ en 
ce que les acides nucl6iques sont inserts tels quels, sans traitement par une 
ou plusieurs endonucleases de restriction prealablement d leur insertion 
dans le vecteur de clonage et/ou d'expression. 
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30. Collection d'acides nucteiques constitute des acides nucl6iques 
obtenus par le proc6de selon I'une des revendications 1 d 6. 

31. Acide nucl6ique caract6ris6 en ce qu'il est contenu dans la 
collection d'acides nuclSiques selon le revendicatlon 30. 

32. Acide nucleique selon le revendication 31, caract6ris6 en ce 
qu'il comprend une sequence nucteotidique codant au moins un op6ron, ou 
une partie d'un opdron. 

33. Acide nucleique selon la revendication 32, caract6ris§ en ce 
que I'opSron code pour la totalit6 ou une partie d'une vole m6tabolique. 

34. Acide nucleique selon la revendication 33. caract6ris6 en ce 
que la voie metabolique est la voie de synthese des polyk6tides. 

35 Acide nucleique selon la revendication 34, caract6ris6 en ce qu'il 
est choisi parmi les polynucl6otides comprenant les s6quences SEQ ID N' 
30^i44etSEQIDN» 115^ 120. 

36. Acide nucleique selon la revendication 31, caract6ris6 en ce 
qu'il comprend la totalit6 d'une sequence nucl6otidique codant pour un 
polypeptide 

37. Acide nucl6ique selon I'une des revendications 31 d 36. 
caract6rise en ce qu'il est d'origine procaryote. 

38. Acide nucl6ique selon la revendication 37, caract6ris6 en ce 
qu'il provient d'une bact6rie ou d'un virus. 

39. Acide nud6lque selon I'une des revendications 31 ^ 33 et 36. 
caract§ris6 en ce qu'il est d'origine eucaryote. 

40. Acide nucl§ique selon la revendication 39, caract6ris6 en ce 
qu'il provient d'un champignon, d'une levure, d'une plante ou d'un animal. 
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41. Vecteur recombinant caract6ris6 en ce qu'il est choisi parnii les 
vecteurs recombinants suivants : 

a) un vecteur comprenant un acide nucl6ique selon I'une des 
revendications 35 d 40; 

b) un vecteur obtenu selon le proc6d6 de I'une des revendications 22 d 
25 et 29; 

c) un vecteur obtenu selon le precede de I'une des revendications 26 d 
29. 

42 Vecteur caractSris^ en ce qu'il s'agit du cosmide pOS 7001. 

43. Vecteur caract^rise en ce qu'il s'agit du cosmide pOSV303. 

44. Vecteur caract6ris6 en ce qu'il s'agit du cosmide pOSV306. 

45. Vecteur caract6ris6 en ce qu'il s'agit du cosmide pOSV307. 

46. Vecteur caract6ris6 en ce qu'il s'agit du cosmide pOS 700R. 

47. Vecteur caract6ris6 en ce qu'il s'agit du vecteur BAG pOSV403. 

48. Vecteur caract^risd en ce qu'il s'agit du vecteur pMBD-1. 

49. Vecteur caract^ris^ en ce qu'il s'agit du vecteur pMBD-2 

50. Vecteur caract^rise en ce qu'il s'agit du vecteur pMBD-3. 

51. Vecteur caract6ris6 en ce qu'il s'agit du vecteur pMBD-4. 

52. Vecteur caract§ris6 en ce qu'il s'agit du vecteur pMBD-5. 

53. Vecteur caract6ris§ en ce qu'il s'agit du vecteur pMBD-6. 
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54. Collection de vecteurs recombinants tels qu'obtenus selon le 
proc^d§ de Tune des revendications 7 d 21 , 25 et 28. 

55. Vecteur recombinant de clonage et/ou d'expression caract6ris§ 
en ce qu'il est contenu dans la collection de vecteurs recombinants selon la 
revendication 54. 

56 Cellule hdte recombinante comprenant un acide nucl^ique selon 
I'une des revendications 31 d 40 ou un vecteur recombinant selon la 
revendication 55. 

57. Cellule hdte recombinante selon la revendication 56, 
caract6ris6e en ce qu'il s'agitd'une cellule procaryote ou eucaryote. 

58. Cellule hdte recombinante selon la revendication 57, 
caract§ris§e en ce qu'il s'agit d'une bact^rie. 

59. Cellule hdte recombinante selon la revendication 58, 
caract6risee en ce qu'il s'agit d'une bact6rie choisle panni £ coli et 
Streptomyces. 

60. Cellule hdte recombinante selon la revendication 58, 
caract§rls6e en ce qu'il s'agit d'une levure ou d'un champignon filamenteux. 

61. Collection de cellules hdtes recombinantes, chacune des 
cellules hdtes constitutives de la collection comprenant un acide nucl^ique 
de la collection d'acides nucl6lques selon la revendication 30. 

62. Collection de cellules hdtes recombinantes, chacune des 
cellules hdtes constitutives de la collection comprenant un vecteur 
recombinant selon I'une des revendications 41 ou 55. 

63. Proc6d6 de detection d'un acide nucleique de s6quence 
nucl^otidique d^temiinee, ou de sequence nucl^otidique stmcturellement 
apparent6e d une sequence nuctSotidique dStemnin^e, dans une collection 
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de cellules h6tes recombinantes selon Tune des revendications 61 ou 62, 
caract^rise en ce qu'il comprend les 6tapes suivantes : 

- mettre en contact la collection de cellules hdtes recombinantes avec 
un couple d'amorces hybridant avec la sequence nucl6otidique 
d6termin6e ou hybridant avec la sequence nucl6otidique 
structurellement apparent6e d une sequence nucteotidique 
d6tenninee ; 

- realiser au moins trois cycles d'amplificatlon ; 

- d6tecter I'acide nucl6ique 6ventuellennent amplifi§.. 

64. Proc6d6 de detection d'un acide nucl6ique de sequence 
nucteotidique d6tennin6e, ou de sequence nucl6otidique structurellement 
apparent6e d une sequence nucl6otidique d6termin§e, dans une cpllection 
de cellules hdtes recombinantes selon I'une des revendications 61 ou 62, 
caract^risS en ce qu'il comprend les stapes suivantes : 

- mettre en contact la collection de cellules hdtes recombinantes avec 
une sonde hybridant avec la sequence nucl6otidique d§termln6e ou 
hybridant avec une sequence nucl6otidique structurellement 
apparent6e d la sequence nucleotidique d6tennin§e ; 

■ detecter I'hybride 6ventuellement fonn6 entre la sonde et les acides 
nucl§iques compris dans les vecteurs de la collection. 

65. Proc6d6 pour identifier la production d'un compos§ d'inter§t par 
une ou plusieurs cellules hdtes recombinantes dans une collection de 
cellules hdtes recombinantes selon I'une des revendications 61 ou 62, 
caract6rise en ce qu'il comprend les stapes suivantes : 

- culture des cellules hdtes recombinantes de la collection dans un 
milieu de culture appropriS ; 

- d6tection du compos6 d'int6rdt dans le sumageant de culture ou dans 
le lysat cellulaire d'une ou plusieurs des cellules hdtes recombinantes 

cultiv^es. 

66 Proc6d6 pour s6lectionner une cellule hdte recombinante 
produisant un compos§ d'int6rdt dans une collection de cellules hdtes 
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recombinantes seion I'une des revendications 61 ou 62, caractSris^ en ce 
qu'il comprend les stapes suivantes : 

- culture des cellules hdtes recombinantes de la collection dans un 
milieu de culture appropri^ ; 

- detection du compost d'int^ret dans le sumageant de culture ou dans 
le lysat cellulaire d'une ou plusieurs des cellules hdtes recombinantes 
cultivees. 

- selection des cellules hdtes recombinantes produisant le compost 
d'int§r§t. 

67. Proc6d6 pour la production d'un compost d'intSrSt caractSris6 
en ce qu'il comprend les Stapes suivantes : 

- cultiver d'une cellule hdte recombinante s6lectionn6e selon le proc6d§ 
de la revendication 66; 

- rScupSrer et, le cas SchSant, purifier, le compost produit par ladite 
cellule hdte recombinante. 

68. Compose d'Interet caractSris§ en ce qu'il est obtenu selon le 
proc6d6 de la revendication 67. 

69. Compost selon la revendication 68, caract6ris6 en ce qu'il s'agit 
d'un polykStide. 

70. PolykStide caractSrisS en ce qu'il est produit grdce ^ 
I'expression d'au moins une sequence nucldotldique comprenant una 
sequence choisie pamii les sequences SEQ ID H'ZO d 44 et SEQ ID N^HS 
d 120. 

71. Composition comprenant un polykStide selon la revendication 

69 ou 70. 

72. Composition pharmaceutique comprenant une quantity 
phannacologiquement active d'un polykStide selon la revendication 69 ou 70, 
en association avec un vdhicule phamiaceutiquement compatible. 
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73. Proc^dS de determination de la diversity des acides nucldiques 
contenus dans une collection d'acides nuci^iques et tout particuliSrement 
d'une collection d'acides nucl^iques provenant d'un ^chantillon de 
renvironnement, preferentiellement d'un echantillon du sol, ledit proc6d6 
comprenant les §tapes suivantes: 

- mise en contact des acides nucieiques de la collection d'acides 
nuclelques d tester avec un couple d'amorces oligonucteotidiques hybridan! 
d toute sequence d'ADN ribosomai 16 S bactdrien; 

- realisation d'au moins trois cycles d'ampllficatlon; 

- detection des acides nucieiques amplifies d I'aide d'une sonde 
oligonucleotldique ou d'une pluralite de sondes oligonucieotidiques, chaque 
sonde hybridant specifiquement avec une sequence d'ADN ribosomai 16 S 
commune d un regne, un ordre, une sous-classe ou un genre bacterien; 

- le cas echeant, comparer les resultats de I'etape de detection 
precedente avec les resultats de detection, d I'aide de la sonde ou de la 
pluralite de sondes, d'acides nucieiques de sequence connue constituant 
une gamme etalon. 

74. Proc6d6 seion la revendication 73, caract6rise en ce que le 
couple d'amorces hybridant d toute sequence d'ADN ribosomai 16 S 
bacterien est constitu6 de I'amorce FGPS 612 (SEQ ID N''12) et de I'amorce 
FGPS 669 (SEQ ID N'13). 

75. Precede selon la revendication 73, caracteris6 en ce que le 
couple d'amorces hybridant d toute sequence d'ADN ribosomai 16 S 
bacterien est constitue de I'amorce 63 f (SEQ ISD N*'22) et de I'amorce 1387 
(SEQ ID N"'23). 

76. Acide nucleique comprenant une sequence nucieotidique 
d'ADNr 16S choisle parmi les sequences possedant au moins 99% d'Identite 
en nucleotides avec les sequences SEQ ID N" 60 e SEQ ID N" 106. 

77. Precede de production d'une polyketide synthase de type I, ledit 
precede de production comprenant les etapes suivantes: 

- obtention d'une cellule hote recombinante comprenant un acide 
nucieique codant pour une polyketide synthase de type I comprenant une 
sequence nucieotidique choisle pamii les sequences SEQ ID N°33 e SEQ ID 
N"44, SEQ ID N''30 k SEQ ID N''32 et SEQ ID N» 1 15 ^ SEQ ID N''120. 
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- culture des cellules hdtes recombinantes dans un milieu de culture 
appropri6; 

- r6cup6ration et, le cas 6ch6ant, purification de la polyk6tide 
synthase de type I a partir du sumageant de culture ou du lysat cellulaire. 

78. Polyk6tide synthase comprenant une sequence d'acides 
amines choisie parmi les sequences SEQ ID WAS S 59 et SEQ ID N" 121 a 
SEQ ID NM26. 

79. Anticorps dirig6 centre une polyketide synthase selon la 
revendication 78. 

80. Proc6de de detection d'une polyk6tlde synthase de type I ou 
d'un fragment peptidique de cette enzyme, dans un Schantillon. ledit proc6d6 
comprenant les Stapes de: 

a) mettre en contact un anticorps selon la revendication 79 avec 
rSchantillon d tester; 

b) d6tecter le complexe antigSne/anticorps 6ventuellement fonn6. 

81. N^cessaire de detection d'une polyk§tide synthase de type I 
dans un 6chantillon comprenant: 

a) un anticorps selon la revendication 79; 

b) le cas 6cheant, des reactifs n6cessaires d la detection du 
complexe antigSne/anticorps 6ventuellement fom§. 
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Sol sec et tamise 



. Determination de I'ADN extracellulaire: 
Homog6neisation de la suspension de sol (Vortex) 

2. Broyage du sol sec. 

I 3. Homogen§isation de la suspension de sol 

- 4a. Sonication ^ I'aide d'une micro-pointe 
' — 5a. Lyse par le lysozyme et le SDS 

- 4b. Sonication a Taide du dispositif Cup Horn 
1 — 5b. Lyse sur le lysozyme et le SDS 
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Figure 3 
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Figure 5 
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FIGURE 9 
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Figure 10 



wo 01/40497 



12/38 



PCT/FR0O/033H 



fiamHI32 




Figure 11 
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Figure 12 
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Clal (3644) 



Figure 14 
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FIGURE 15 



wo 01/40497 



PCTAFROO/03311 



17/38 




Figure 16 
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Figure 17 
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Figure 18 
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Xbal(4434) 



Figure 19 
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Figure 20 
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Figure 21 
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Figure 22 
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Figure 23 
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VLGLQGPSMA 
VLGLQGPAMA 
LLDLRGPSMA 
TFDFRGPSIA 
FLDLRGPSVA 
FLGLRGPOKT 
IY0LRGPSLT 
FFDFRGPSIA 



VOfTACSTSLV 
VQSACSTGLV 
VCTACSTSLV 
VQITACSSSLV 
VHANCSSSLI 
VDTACSSSLV 
VDTACSSSLV 
VDTACSSSLV 
VDTACSSSLV 
VDTACPSSLV 
VDTACSSSLV 
VCTACSSALV 
VDTACSSSLV 
VDTACSSSLV 
LNTACSSALV 
VDTACSSSLV 
LDTACSSSLM 



SWtACESLQ 
AVCQMQNLQ 
AVHE^CQALR 
AVHV?AQSLL 
GLHSAYKSLL 
ALHLAAQALP 
ALHLAAQALR 
AVHLACQSIR 
AVHLACRSLQ 
AIHLACQSLR 
AIHLACQSLR 
AVHLA.CQSLR 
AIHLACQSVR 
AIHU^CQSLR 
AMHQARQSIL 
ALHQAVEUA 
ALQNAYQ^IH 



150 

RGASDZALAG 
TYQCDMALAG 
LGECDMALAQ 
AGECDIALAG 
SGESDYALVG 
AGECELALVG 
RGECOLALAG 
RGESSLAMAG 
SRECSIALAG 
NRECRM^LAG 
NDDCRVAVAG 
RRECDAAFAG 
RGEAELAVT^ 
TQOCHU^IAA 
LGESSVALVG 
S^IETArVG 
SGQCPAAIVG 



Figure 24 
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FIGURE 27 
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FIGURE 28 
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FIGURE 29 
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FIGURE 30 
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FIGURE 3H 
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FIGURE 37 
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LISTE DE SEQUENCES 

<110> Aventis Pharma S.A. 

<120> Procgde d'obtention d'acides nucl^iques ^ partir d'un 
echantillon de sol, acides nucliiques ainsi obtenus et 
leur application h la synthese de coraposgs 

<130> Banque d'ADN du sol - RPR S.A. 

<140> 

<141> 

<150> FR9915032 
<151> 1999-11-29 

<160> 126 

<170> Patentin Ver. 2,1 

<210> 1 
<211> 15 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: sonde 
FGPS431 

<220> 

<221> variation 
<222> (14) 

<223> Base A remplacge par G 
<400> 1 

acgggcggtg tgtac 



<210> 2 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce 
FGPS122 



<400> 2 

ggagagtttg atcatggctc ag 



22 
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<210> 3 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce 

FGPS350 

<400> 3 

cctggagtta agccccaagc 



<210> 4 
<211> 24 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: sonde 
FGPS643 

<220> 

<221> variation 
<222> (20) 

<223> T remplacge par C 
<400> 4 

gtgagtnnna acctgcccct gact 

<210> 5 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: sonde 
FGPS643-2 

<400> 5 

gtgagtaacc tgcccccgac t 

<210> 6 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
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3 



<220> 

<223> Description de la sequence artificielle: amorce 
R499 



<400> 6 

ttaattcact tgcaactgat ggg 



23 



<210> 7 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Desciription de la sSquence artificielle: amorce 



<210> 8 
<211> 25 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: sonde C501 



<210> 9 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce 
FGPS516 

<400> 9 

tccagatcct tgacccgcag 20 



<210> 10 
<211> 20 
<212> ADN 

<213> Sequence artif icielljs 



R500 



<400> 7 

aacgatagct cctacatttg gag 



23 



<400> 8 

ttgctgatac ggtatagaac ctggc 
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<220> 

<223> Description de la sequence artificielle: amorce 
PGPS517 

<400> 10 

cacgacattg cactccaccg 



<210> 11 
<211> 16 
<212> ADN 

<213> S^cjuence artificielle 
<220> 

<223> Description de la sequence artificielle: sonde 
FGPS518 

<400> 11 

ccgtgagccg gatcag Ig 



<210> 12 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la aSquence artificielle :FGPS612 

<220> 

<221> variation 
<222> (2) 

<223> Base C remplacSe par T 
<220> 

<221> variation 
<222> (7) 

<223> Base T remplacSe par C 
<220> 

<221> variation 
<222> (7) 

<223> Base T remplacSe par A 
<400> 12 

ccaacttcgt gccagcagcc 



:210> 13 
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<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle :FGPS669 
<220> 

<221> variation 
<222> (7) 

<223> Base A remplacge par G 
<220> 

<221> variation 
<222> (13) 

<223> Base A ren^lacSe par C 
<400> 13 

gacgtcatcc ccaccttcct c 21 



<210> 14 
<211> 18 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle:FGPS618 
<220> 

<221> variation 
<222> (5) 

<223> Base T remplac^e par C 
<400> 14 

atggttgtcg tcagctcg 19 

<210> 15 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<:220> 

<223> Description de la sequence artificielle :FGPS6 14 



<400> 15 

gtgtagaagt gaaattcgat t 



21 
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<210> 16 
<211> 18 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle :FGPS615 
<400> 16 

cggtggatga tgtggatt 



<210> 17 
<211> 18 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle :FGPS616 
<400> 17 

aggttaaaac tcaaatga ig 



<210> 18 
<211> 18 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle:FGPS621 
<400> 18 

atacgtaggt ggcaagcg 



<210> 19 
<211> 19 
<212> ADN 

<213> sequence artificielle 
<220> 

<223> Description de la agquence artif icielle:FGPS617 
<400> 19 

gccggggtca actcggagg 19 



<210> 20 
<211> 18 
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<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle:FGPS680 
<220> 

<221> variation 
<222> (11) 

<223> Base A remplac€e par C 
<220> 

<221> variation 
<222> (11) 

<223> Base A remplacSe par T 
<220> 

<221> variation 
<222> (13) 

<223> Base T remplac6e par A 
<400> 20 

tgagtcccca actccccg 18 



<210> 21 
<211> 20 
<212> ADN 

<213> sequence artificielle 
<220> 

<223> Description de la sSquence artif icielle:FGPS619 
<400> 21 

gcttggggct taactccagg 



<210> 22 
<211> 21 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artif icielle: amorce 63f 
<400> 22 

caggcctaac acatgcaagt c 21 



<210> 23 
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<211> 18 
<212> ADN 

«:213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
1387r 

<400> 23 

gggcggngtg tacaaggc 18 



<210> 24 
<211> 30 
<212> ADN 

<213> S€(}uence artificielle 
<220> 

<223> Description de la sequence artificielle :oligo-l 



<400> 24 

gcttatttaa atattaagcg gccgcccggg 

<210> 25 
<211> 28 
<212> ADN 

<213> Sequence artificielle 



30 



<220> 

<223> Description de la sequence artificielle :oligo- 2 
<400> 25 

cccgggcggc cgcattaata tttaaata 



<210> 26 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce al 
<400> 26 

ccncagnagc gcntnttnct nga 



<210> 27 
<211> 22 
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<212> ADN 

<213> Siquence artificielle 
<220> 

<223> Description de la sequence artificielle :amorce a2 
<400> 27 

gtnccngtnc cgtgngtntc na 22 

<210> 28 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce bl 
<400> 28 

ccncagnagc gcntnctnct nga 23 

<210> 29 
<211> 22 
<212> ADN 

<213> sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce b2 
<400> 29 

gtnccngtnc cgtgngcctc na 22 

<210> 30 
<211> 672 
<212> ADN 

<213> Streptomycea ambofaciens 

<400> 30 

ccccagcagc acgtgttcct cgagacggtg tgggagacct tcgaatccgc cggagtggac 60 
ccgcgcgcgg tacgcggtcg ttccgtcggg atgttcgtcg gcaccaacgg acaggactac 120 
ccggtggtgt tggccggatc cgccgacgag ggcctggacg cccacgcggc caccggtaac 180 
gcggcggcgg tgctgtccgg ccgggtctcg tacgccttcg gcctggaagg gccggcggtc 240 
accgtcgaca cggcgtgttc gtcgtcgctg gtggcccttc acctggccgc gcaggcgctg 300 
cggcgcggcg agtgcgatct ggcactcgcc ggcggtgtgt cggagatgtc caccgaggcg 360 
gcgttcaccg agttcgcccg gcagggcggc ctggccgacg acggccgctg caaggccttc 420 
tcggccgacg ccgacggcac gggctggggc gagggcgtcg gcgtcctgct ggtggagcgg 480 
ctggcggacg cccgccgcaa cgggcaccgg gccctcgcgc tggtacgggg cagcgcggtc 540 
aaccaggacg gcgcctccaa cggtctgacg gcacccaacg gcccgtccca gcagcgagtc 600 
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atccggcagg cactggcgga cgcccggctg tcgccgtcgg aggtcgacgc ggtcgagacc 660 
cacggcaccg gc 672 



<210> 31 
<211> 665 
<212> ADN 

<213> Streptomyces ambofaciens 
<400> 31 

ccccagcagc gcgtgttcct ggaagcgtcc tgggaggcgg tcgagcgggc aggcatcgac 60 
atgcgcaccc tgcgcggtgg acgcaccggc gtcttcgccg gcgtgatgta ccacgactac 120 
ccgtcggtgg tcgaccccga agcgctcgac ggctacctgg gcacggccaa cgccggcagc 180 
gttctctccg gccgcatcgc ctacaccttc gggcttcagg gaccggcggt caccgtggac 240 
acggcctgct cctcgtccct ggtggcgctg cacctcgccg cccaggcgct gcccgccggc 300 
gagtgcgaac tcgccctggt cggtggggtc acggtcatgt ccggcccgat gatgttcgcg 360 
ggcttcggcc tggaagacgg ctctgccgcc gacggccgct gcaaggcgtt cgccgccgcc 420 
gccgacggca ccggctgggg cgagggtgtc ggtgtgctgc tggtggagcg gctgtcggac 480 
gcccggcgcc acgggcaccg ggtgctggcc gtggtgcgcg gtagcgcggt caaccaggac 540 
ggtgcctccg gcggcctcac cgcccccaac ggacctgccc agcagcgcgt catccgtcag 600 
gccctggcga gcgcggcact cgtaccggcc gaggtcgacg cggtcgagac ccacggcacc 660 

gggac 665 



<210> 32 
<211> 671 
<212> ADN 

<213> Saccharopolyspora erythraea 
<400> 32 

ccgoaggagc gcgtgttcct ggaactcgct tgggaagcac ttgataacgc gggcatcgca 60 
ccgcacagcc tcagggacag ccggacgggc gtgttcttcg gagctatgtg gcacggctac 120 
gcgcagttcg cagccggagc cgtcgaccgc atcacccagc acaccgcgac cgggcacgac 180 
ctgagcatca tcccggccag gatcgcctac ttcctgggct tgcgcggccc ggacatgacc 240 
ctgaacaccg cgtgctcatc ggctttggtg gccatgcacc aggcacgcca aagcatcctg 300 
ctgggcgaat cctcggtcgc cttggtcggc gggatcagct tgttggtcgc gctggacagc 360 
atggtcgcca tgtcgcggtt cggagcgatg gccccggacg gccggtgcaa ggcattcgac 420 
tctcgcgcga acggctacgt gcgcggcgaa ggcggcggtg tcgtggtgct caaaccgctg 480 
tcgcgcgctc tggccgatgg caacccggtc tactgcgtcc tgcgcggcag cgcggtcaac 540 
aacgacggct tcagcaatgg ccttaccgcg ccgagcccgg cggcgcagga gcaggtactg 600 
cgcgacgcct acgccaacgc cggggtcgat ccggcacagg tcgactacgt cgagacccac 660 
gggaccggca c 671 



<210> 33 
<211> 686 
<212> ADN 

<213> Organime Inconnu 



<220> 
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<223> Origine de la sequence rorganisme du sol 

<400> 33 

ccgcaggagc gcgtgttcct cgagtcgtgc tgggaggcgc tggagcatgc tggatacgat 60 

actgcacgct accccggccg catcgggctg tgggccggcg cgggcttcaa cagctacctc 120 

ctgaccaatc tcatgaacaa ccgcgccttt ttagagagcg tgggcatgta ccagatcttt 180 

ctgagcaacg acaaggactt catcgccacc cgcacggctt acaagttaaa cctgcgcggt 240 

ccggcgatgg ccgtcggcac cgcctgttcc acatcgctgg tggcggttca cgaagcttgc 300 

caggcgctgc ggctgggcga gtgtgacatg gcactggccg gtgctgcgtc tgtcagcacg 360 

cccctccggg agggctacct ctaccaggaa ggcatgatta tgagccgtga cggcgtctgc 420 

cgcccgtttg acgccgacgc cgatggcacg gtgctgggca atggcgtggc ggtcgtggtg 480 

ctcaagcggc tggacgaagc gctccgggac ggtgacacgg tctacgccgt gattcgtggc 540 

acggcggtca acaacgacgg ctctgtcaag atcgggttca cggcgcccag cgccgagggg 600 

cagagccggg tcgtgcggga cgccctgcgg gcggccgcgg tcccggcgga gagcgtgacc 660 

tacgtcgaca cgcacggcac cggcac * 686 



<210> 34 
<2H> 689 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :organisme du sol 
<400> 34 

ccccagcagc gcctgttcct cgagtgcgcg tgggaagcga tggagaacgc gggatatgcg 60 
gcgcgaagct ataagggttc gatcggcgtt ttcgcgggat gcggcgtcaa tacctacctg 120 
ctgaacaacc tcgccaccgc ggagccgttc gatttctcac gcccctccgc gtaccagctg 180 
ctgacggcca acgacaagga tttcctggcc acgcgtgtct cttacaagct gaacctccgc 240 
gggcccagcc tgacggttca gacggcgtgc tccacctcgc tggtgtcggt ggtgatggca 300 
tgcgagagct tgcagcgcgg cgcctcggac attgccttgg ccgggggagt tgccatcaat 360 
gttccgcagt ccgtggggta cctgcaccag ccgggcatga tcctgtcgcc cgacgggcgc 420 
tgccgcgcct tcgatgagtc cgctcaaggc acggtgccgg gcaacggcgc gggtgtggtc 480 
gtcctcaagc gcttgagccg cgctctggcc gatggcgaca cgatctacgc cgtcattcgc 540 
ggagcggcta ttaataatga tggcgccgag cgcatggggt ttaccgctcc aggtgtggac 600 
ggtcagacgc gattgattcg gcgcactcaa gagatggcgg gcgtgaagcc ggagtccatc 660 
ggctacatgg acacccacgg caccggcac 689 



<210> 35 
<211> 671 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :organisme du sol 
<400> 35 

ccgcagcagc gcctcttcct cgaggtggca tgggaagctt tggagcgtgc gggtcggccg 60 
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cccgacagtc tcgcgggcag cgacaccgga 
agccggctga aacctaccga tccggcgctc 
ttcagcactg ccgccggacg gatctcctat 
gtcgacacgg cgtgctcttc ctcactcgtg 
tcgcgagagt gcagcatggc gctggccggc 
acgatctact tctgccgcct gcgggccatg 
gcctccgccg acggttacgg ccgcggcgag 
tccgatgcga cgcgtgacgg cgatcgtatt 
cacggcggcc gcagcaacgg cctcacggcg 
cgggcggcgc tcaagaacgc cggcatggcc 
ggcaccggca c 



gtgttcatcg ggatcagcac cgacgactac 120 
attgacgcct ataccggtac cggaaccgcg 180 
ctgctggggt tgcagggacc gaacttcccc 240 
gcggttcatc tggcgtgccg cagcttgcag 300 
ggcgtgaacc tgattctggc gccggaaagc 360 
gcggccgatg gccgttgcaa aagtttcgct 420 
ggatgcggaa tgctggtgct gaagcggctg 480 
ctggcgctga ttcgcggatc ggccgtcaac 540 
ccgaacggtc cggcgcagga agccgtgatt 600 
cccgccgatg tcgattacgt ggacacccac 660 
671 



<210> 36 
<211> 758 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :organisme du sol 
<400> 36 

ccgcaggagc gcgtcttcct cgaacgcatt gacggtttcg atgcggaatt cttcggcatc 60 
tccccccgcg aagctctgaa catggatccg cagcagcggc tgctgctgga agtgtgctgg 120 
gaagcggcag aggacgccgg catctctccc ggccctctgg cgggcagcgc gaccggcgtc 180 
tttgccggct cctgcgccca ggacttcgga ctgtttcagt acgccgaccc tgcccgcatc 240 
ggagcttggt cgggttccgg cgtggcgcat agcatgttgg ccaatcgcat ctcctatctg 300 
ctcgacctgc gcggtccgag catggcggtc gatacggcct gctcctccgc gctcgtcgcc 360 
gtccatctgg cttgccaaag cctgcgccgg cgcgaatgcg atgcggcatt cgccggcgga 420 
gtgaacttga tcctgactcc cgagggcatg atcgctttgt cgaaggctcg catgttggcg 480 
cccgacggac gctgcaagac gttcgacgcc gcagccgacg gttatgtgcg cggcgagggc 540 
tgcggcatcg tgctgctgaa gcggctctcc gatgcgctgg ccgatggcga tgccatctgt 600 
gcagtcatcc gcggctcggc aatcaatcag gacggacgga gcaatggcat cacggcgccg 660 
aatctgcagg cgcagaaggc ggtcctgcaa gaggcggtgg ccaacgcgca catcgatcca 720 
tcccacgtat cgttgatcga cacgcacggc accggcac 758 



<210> 37 
<211> 704 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :organisme du sol 

<400> 37 

ccgcagcagc gcgtgttcct cgagtgcgcc tgggaggcgg tggaaagcgc gggctacgat 60 
cccgaaaaat atcccggcct gatcggagtt ttcgccgggg ccagcatcaa cagctatttc 120 
ctttataacc tcgcgcacaa ccgggaattc gtcgcccgca tggcggggga gtaccaagtg 180 
ggcgagtacc agacgatcct cggaaacgac aaggactacc tccccactcg cgtctcctac 240 
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aaattgaacc tgcgcggccc cagcctggcc gtgcagtccg cctgctcgac cggcctcgtc 300 
gccgtttgtc aggccattca aaatctgcag acttatcagt gcgatatggc cctcgcgggc 360 
ggcatctcga tttcgtttcc gcaaaagcgc gactaccgct tcaccgacga aggaatggtc 420 
tctcgcgacg gtcactgccg cccgttcgac gccagcgcgc aaggcacggt cttcggcaac 480 
ggggccggcg tcgtcctgat gaaaagattg gccgacgcag tgaccgatcg ggacacgatc 540 
ctcgccgtga ttaggggcgc tgccgtgaac aacgacggcg gcgtcaaaat gggttacacg 600 
gcgcccagtg ccgaaggtca ggcggaggcc atcaccctgg ccctcgcgct cgctggcgtc 660 
agcccggaga ccatcacttg catggacacc cacggcaccg gcac 704 



<210> 38 
<211> 680 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence torgeuiisme du sol 

<400> 38 

ccccagcagc gcgtgttcct cgaatgcgcc tgggcggcgc tggagcgccg ccggatatca 60 
gggcgacacc ttccacggtg tccatcggcg gtctatgcct caagcggctt taacacctat 120 
cttctgaacc tgcatgccaa tgccgcggtg cgccaatcga tcagcccgtt tgaactgttc 180 
gtcgccaacg acaaggattt tctggcgacg cgcacggctt acaagctcaa tctgcgcggc 240 
ccggccatga cagtgcagac ggcctgctcc tcatcgttgg ttgccgttca tgtcgccgcg 300 
caaagcctcc tagcgggcga atgcgatatt gcgctcgcgg gcggcatcac ggtttcccgt 360 
tcgcatggat atgtggcgcg cgaaggtgga atattgtctc ctgacgggca ttgccgggcg 420 
ttcgatgcgg atgccggcgg aaccgttcca ggcagcggcg tcggcgttgt cgtgctcaag 480 
cgtctcgaag atgcgcttgc agacggcgat acgatcgacg ccgtcatcat cggttcggcc 540 
atcaacaatg atggcgcgct gaaggcgagc tttaccgcac cgcaggtgga cagccaggcc 600 
ttggtcatca gcgaggccca tgcagctgcc ggaatatcgg ccgattccat cggttatatg 660 
gacacccacg gcaccgggac g8o 



<210> 39 
<211> 671 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence rorganisme du sol 

<400> 39 

ccgcagcagc gcctcttcct cgagctcacc tgggaagcgc tggaagatgc cggcatcccg 60 
ccgtccacga ttgccggcac gaatgtcggc gttttcatgg gcgcgtcgca ggctgactac 120 
ggccacaagt tcttcagcga ccacgccgtc gcggattccc atttcgccac cggcacctcg 180 
ctggcggtcg tcgccaatcg catttcctac atctacgacc tgcgcggccc aagcctcact 240 
gtagacacgg cgtgctcgtc gtcgctcgtc gcgctgcatc aggcggtgga agcgctccgc 300 
tcggggcgga tcgaaacagc cattgtcggc ggcattaacg ttatcgccag cccggcgtcc 360 
ttcatcgcct tctcgcaggc ctcgatgctg tcgccgacgg ggttgtgcca ggctttctcc 420 
gccaaggccg atggctttgt ccgcggcgag ggcggcacgg ttttcgtcct gcgcaaggcg 480 
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gcgcatgcgc atggcagccg caacccggtg 
tccgacgggc gtaccaacgg catctcgctg 
caacgcgtct attcacgcgc atcgatcgat 
gggaccggca c 



cgcgggctca ttctcgccac cgacgtcaat 540 
ccatcggccg aagcgcagga agtcctcctg 600 
ccgaaccgcc tggctttcgt cgacacccac 660 
671 



<210> 40 
<211> 764 
<212> ADN 

<213> Organime Inconnu 



<220> 

<223> Origine de la sequence. :organisme du sol 



<400> 40 

ccgcagcagc gcgtgttcct cgacggcatc 
acgccgcgcg aggcgatcag catggacccg 
gaagcgctgg agcgcgccgg cgtggcgccc 
ttcatcggca tcagcaccaa cgactacggc 
gatccgggga tgtacttcgg caccggcaac 
tacgtcctcg gcctgcaggg tccgagcatg 
gtggcgattc atctcgcgtg tcagagcctg 
ggcggcgcca acctggtgct cgtcccggaa 
ctcgcgcctg acgggcgctg caagacgttc 
gaaggggccg cggtgatcgt gctgaagcgg 
atcgtcgcgc tgatccgcgg atccgcggtc 
gcgccgaacg aactggcgca gcaggcggtg 
gccgcgtccg acatcggcta cgtggacacg 



gaccggttcg atccgcgtca cttcgcgatc 60 
cagcagcggc tcctgctcga ggtcacgtgg 120 
gatcgcctga ccggatccga caccggcgtc 180 
cagatcctgc tgcgcgcctc ggaccagatc 240 
ctgttgaacg cggcggcggg acgcctctcg 300 
gcggtcgaca ccgcatgtcc gtcgtcgctg 360 
cgcaaccgcg agtgccgcat ggcgctcgcc 420 
gtgacggtca actgctgccg cgccaagatg 480 
gacgccgcgg cggacggcta cgtccgcggc 540 
ctctccgacg cgctggcgga cggcgatccg 600 
aatcaggacg gccgcagcgg cggcttcacc 660 
atccggaccg cgctcgcggc agcgggcgtc 720 
cacggcaccg ggac 764 



<210> 41 
<211> 763 
<212> ADN 

<213> Organime Inconnu 



<220> 

<223> Origine de la aSquence zorganisme du sol 

<400> 41 

ccgcagcagc gcgtgttcct cgacggcatc gaccgcttcg atccgcagtt tttcgggatc 60 
gcgccgcgcg aagcggccgg catcgatccg cagcagcggc tgctgctcga gacgacgtgg 120 
gaagcgctgg aagacgccgg gacgtcgccg gaaaagctgc agggaacccc ggccggcgtg 180 
ttcgtcggca tcaacagcat cgactacgcg acgctgcagc tgcagaactg cgatctggcc 240 
agcatcgacg cctattcgct ctccggcagc gcgcacagca tcgcggccgg gcggctcgcc 300 
tacgtgctcg gcctgcaggg gccggcgatg gcggtcgaca ccgcctgctc gtcgtcgctg 360 
gtcgcgatcc acctggcgtg ccagagcctg cgcaacgacg actgccgcgt cgccgtggcc 420 
ggcggcgtgc acgtcacgct gacgccgatc aacatggtcg tgttctcgaa gctgcgcatg 480 
ctggcggcgg acggcaagtg caagacgttc gacggccgcg gcgacggatt cgtcgaaggc 540 
gagggctgcg cggtcatcgt cctcaagcgg ttgtcgcacg cgcttgccga caaggatcgg 600 
atcctcgcgc tggtgcgcgg ttcggcggtc aaccaggacg gcgcgagcag cggtctcacc 660 
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gcgccgaacg gtccggcgca ggaagcggtc atccgcgcgg cgttgaagcg ggccggcgtg 720 
cagccggcgg aggtcggcta cgtggacacc cacggcaccg gca 763 



<210> 42 
<211> 668 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de ia sequence :organisme du sol 

<400> 42 

ccgcaggagc gcgtgctgct ggaatcctcg tggcatgcgc tggaagacgc cggctatgcc 60 
ggcgaaagca tcgccggcgc gcgctgcggc gtgtacatgg gcttcaacgg cggcgactac 120 
ggcgacctgc tgtacggcca gccgtcgctg ccgccgcacg cgatgtgggg caacgccgcc 180 
tcggtgctgt cggcgcgcat cgcctattac ctggacctgc aaggcccggc gatcaccctc 240 
gacaccgcct gttcgagctc gttggtcgcg gtgcatctgg cctgccaggg gctgtggacc 300 
ggcgagaccg atctggccct ggccggcggc gtgtggatcc agtgcacgcc cggattcctg 360 
atctcctcca gccgcgccgg catgctctcg ccgaccggcc agtgccgcgc gttcggcgcc 420 
ggcgccgacg gcttcgtgcc gtccgaaggc gtcggcgtgg tcgtgctcaa gcgcctgcag 480 
gacgcgctcg acgccggcga ccacatntac ggcgtgatcc gcggcagcgc gatcaaccag 540 
gacggcgcca gcaacggcat caccgcgccg agcgccgccg cccaggagcg cttgcagcgc 600 
cacgtctacg acagcttcgg catcgacgcc tcgcgcctgc agatgatcga ggcccacggc 660 
accggcac 668 



<210> 43 
<211> 671 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :organisme du sol 

<400> 43 

ccgcaggagc gcgtgctgct ggaggtgact tgggaggcac tcgaagacgc cggccaagac 
gtggaccgtc tggccgggcg gcccgtcggc gtcttcgtcg ggatctcgtc gaacgattac 
ggccagcttc agaacggcga cccggccgac gtggacgcct acgtcggcac cggtaacgcg 
ctgagcatcg ccgccaaccg actcagctac acgtttgact ttcgcggccc gagtctggcg 
gtggacacgg cgtgctcgtc ttcactcgtc gcgatccatc tcgcctgcca gagcgttcgc 
cgcggtgaag cggaactcgc cgtcgcggcc ggcgtcaact tgattctgac ccccggcctg 
acggtgaatt tcacccgcgc cggcatgatg gcgcctgacg gccggtgcaa gacgttcgac 
gcggccgcca acggctacgt gcgcggcgaa ggcgccggcg tcgtcgtgct caagccgctg 
gcccaggcta tcgccgacgg cgacccgatc tacgcgatcg tccgtggcag cgccgtcaac 
caggacggcc gttccaacgg cctcaccgcc ccgaaccgac aggcccaaga ggtcgtgctg 
cgggccgcgt atcgtgacgc gggcatcagc ccggccgatg tcgacgccgt cgaggcccac 
ggcaccggca c 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
671 
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<210> 44 
<211> 707 
<212> ADN 

<213> Organirae Inconnu 
<220> 

<223> Origine de la sequence :organisme du sol 

<400> 44 

ccccagcagc gcgtgttcct cgaggacgcg actgaggtcg acgtggatgc gctttcagac 60 
ggcgaagacg tcgtgatcgc cggcatcatg cagcacatcg aggaggccgg catccactcg 120 
ggcgattcat cgtgcgtgct tccgccggtc gacatcccgc cgaaggcgct gcagacgatc 180 
cgcgatcaca cgttcaagct cgcgcgcgcg ttgaaggtca tcggcctgat gaacgtgcag 240 
tacgcgattc agcgcgacaa ggtctacgtg attgaggtaa accctagggc ttctcgaact 300 
gtcccgtatg tctcgaaggc gacaggcgtg ccgctggcga aggtcgcgtc acgcttgatg 360 
accggacgca aactgcacga gctgttgccg gaaggggtcg agcgcggctg gatcaccacc 420 
gcgggcgaga atttctacgt gaagtcgccg gtcttcccgt ggggtaagtt cccgggcgtt 480 
gacactgtgc tcgggccgga gatgaaatcg accggcgaag tcatgggcgt cgccgacaac 540 
ttcggcgagg ccttcgccaa ggcacagatc gccgccggca catacctgcc gaccgaaggt 600 
accgtcttca tctcggtcaa cgaccgtgac aaaggcaacg tcattcagct ggcgcagcgt 660 
ttctccgaac tcggtttcgg cattgtcgac acgcacggca ccgggac 707 



<210> 45 

<211> 225 

<212> PRT 

<213> Streptomycea ambofaciens 

<400> 45 

Pro Gin Gin His Val Phe 
1 5 

Ala Gly Val Asp Pro Arg 
20 

Val Gly Thr Asn Gly Gin 
35 

Asp Glu Gly Leu Asp Ala 
50 

Leu Ser Gly Arg Val Ser 
65 70 

Thr Val Asp Thr Ala Cys 
85 

Ala Gin Ala Leu Arg Arg 

100 105 110 



Leu Glu Thr Val Trp Glu Thr Phe Glu Ser 
10 15 

Ala. Val Arg Gly Arg Ser Val Gly Met Phe 
25 30 

Asp Tyr Pro Val Val Leu Ala Gly Ser Ala 
40 45 

His Ala Ala Thr Gly Asn Ala Ala Ala Val 
55 60 

Tyr Ala Phe Gly Leu Glu Gly Pro Ala Val 
75 80 

Ser Ser Ser Leu Val Ala Leu His Leu Ala 
90 95 

Gly Glu Cys Asp Leu Ala Leu Ala Gly Gly 
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Val Ser Glu Met Ser Thr Glu Ala Ala Phe Thr Glu Phe Ala Arg Gin 
115 120 125 

Gly Gly Leu Ala Asp Asp Gly Arg Cys Lys Ala Phe Ser Ala Asp Ala 
130 135 • 140 

Asp Gly Thr Gly Trp Gly Glu Gly Val Gly Val Leu Leu Val Glu Arg 
145 150 155 160 

Leu Ala Asp Ala Arg Arg Asn Gly His Arg Ala Leu Ala Leu Val Arg 
165 170 175 

Gly Ser Ala Val Asn Gin Asp Gly Ala Ser Asn Gly Leu Thr Ala Pro 
180 185 190 

Asn Gly Pro Ser Gin Gin Arg Val He Arg Gin Ala Leu Ala Asp Ala 
195 200 205 

Arg Leu Ser Pro Ser Glu Val Asp Ala Val Glu Thr His Gly Thr Gly 
210 215 220 

Thr 
225 



<210> 46 
<211> 207 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 46 

Ala Ser Trp Glu Ala Val Glu Arg Ala Gly He Asp Met Arg Thr Leu 
1 5 10 15 

Arg Gly Gly Arg Thr Gly Val Phe Ala Gly Val Met Tyr His Asp Tyr 
20 25 30 

Pro Ser Val Val Asp Pro Glu Ala Leu Asp Gly Tyr Leu Gly Thr Ala 
35 40 45 

Asn Ala Gly Ser Val Leu Ser Gly Arg He Ala Tyr Thr Phe Gly Leu 
50 55 60 

Gin Gly Pro Ala Val Thr Val Asp Thr Ala Cys Ser Ser Ser Leu Val 
65 70 75 80 

Ala Leu His Leu Ala Ala Gin Ala Leu Pro Ala Gly Glu Cys Glu Leu 
85 90 95 
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Ala Leu Val Gly Gly Val Thr Val Met Ser Gly Pro Met Met Phe Ala 
100 105 110 

Gly Phe Gly Leu Glu Asp Gly Ser Ala Ala Asp Gly Arg Cys Lys Ala 
115 120 125 

Phe Ala Ala Ala Ala Asp Gly Thr Gly Trp Gly Glu Gly Val Gly Val 
130 135 140 

Leu Leu Val Glu Arg Leu Ser Aap Ala Arg Arg His Gly His Arg Val 
145 150 155 160 

Leu Ala Val Val Arg Gly Ser Ala Val Asn Gin Asp Gly Ala Ser Gly 
165 170 175 

Gly Leu Thr Ala Pro Asn Gly Pro Ala Gin Gin Arg Val lie Arg Gin 
180 185 190 

Ala Leu Ala Ser Ala Ala Leu Val Pro Ala Glu Val Asp Ala Val 
195 200 205 



.<210> 47 
<211> 223 
<212> PRT 

<213> Saccharopolyspora erythraea 
<400> 47 

Pro Gin Glu Arg Val Phe Leu Glu Leu Ala Trp Glu Ala Leu Asp Asn 
15 10 15 

Ala Gly He Ala Pro His Ser Leu Arg Asp Ser Arg Thr Gly Val Phe 
20 25 30 

Phe Gly Ala Met Trp His Gly Tyr Ala Gin Phe Ala Ala Gly Ala Val 
35 40 45 

Asp Arg He Thr Gin His Thr Ala Thr Gly His Asp Leu Ser He He 
50 55 60 

Pro Ala Arg He Ala Tyr Phe Leu Gly Leu Arg Gly Pro Asp Met Thr 
65 70 75 80 

Leu Asn Thr Ala Cys Ser Ser Ala Leu Val Ala Met His Gin Ala Arg 
85 90 95 

Gin Ser He Leu Leu Gly Glu Ser Ser Val Ala Leu Val Gly Gly He 
100 105 110 
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Ser Leu Leu Val Ala Leu Asp Ser Met Val Ala Met Ser Arg Phe Gly 
115 120 125 

Ala Met Ala Pro Asp Gly Arg Cys Lys Ala Phe Asp Ser Arg Ala Asn 
130 135 140 

Gly Tyr Val Arg Gly Glu Gly Gly Gly Val Val Val Leu Lys Pro Leu 
145 150 155 160 

Ser Arg Ala Leu Ala Asp Gly Asn Pro Val Tyr Cys Val Leu Arg Gly 
165 170 175 

Ser Ala Val Asn Asn Asp Gly Phe Ser Asn Gly Leu Thr Ala Pro Ser 
180 185 190 

Pro Ala Ala Gin Glii Gin Val Leu Arg Asp Ala Tyr Ala Asn Ala Gly 
195 200 205 



Val Asp Pro Ala Gin Val Asp Tyr Val Glu Thr His Gly Thr Gly 
210 215 220 



<210> 48 
<211> 211 
<212> PRT 

<213> Organime Inconnu 



<220> 

<223> Origins de la sequence rorganisme du sol 
<400> 48 

Ser Cys Trp Glu Ala Leu Glu His Ala Gly Tyr Asp Thr Ala Arg Tyr 
15 10 15 



Pro Gly Arg He Gly Leu Trp Ala 
20 

Leu Thr Asn Leu Met Asn Asn Arg 
35 40 



Gly Ala Gly Phe Asn Ser Tyr Leu 
25 30 

Ala Phe Leu Glu Ser Val Gly Met 
45 



Tyr Gin He Phe Leu Ser Asn Asp Lys Asp Phe He Ala Thr Arg Thr 

50 55 60 

Ala Tyr Lys Leu Asn Leu Arg Gly Pro Ala Met Ala Val Gly Thr Ala 

65 70 75 80 



Cys Ser Thr Ser Leu Val Ala Val His Glu Ala Cys Gin Ala Leu Arg 
85 90 95 
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Leu Gly Glu Cys Asp Met Ala Leu Ala Gly Ala Ala Ser Val Ser Thr 
100 105 110 

Pro Leu Arg Glu Gly Tyr Leu Tyr Gin Glu Gly Met lie Met Ser Arg 
115 120 125 

Asp Gly Val Cys Arg Pro Phe Asp Ala Asp Ala Asp Gly Thr Val Leu 
130 135 140 

Gly Asn Gly Val Ala Val Val Val Leu Lys Arg Leu Asp Glu Ala Leu 
145 150 155 160 

Arg Asp Gly Asp Thr Val Tyr Ala Val He Arg Gly Thr Ala Val Asn 
165 170 175 

Asn Asp Gly Ser Val Lys He Gly Phe Thr Ala Pro Ser Ala Glu Gly 
180 185 190 

Gin Ser Arg Val Val Arg Asp Ala Leu Arg Ala Ala Ala Val Pro Ala 
195 200 205 

Glu Ser Val 
210 



<210> 49 
<211> 229 
<212> PRT 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :organisme du sol 
<400> 49 

Pro Gin Gin Arg Leu Phe Leu Glu Cys Ala Trp Glu Ala Met Glu Asn 
1 5 10 15 

Ala Gly Tyr Ala Ala Arg Ser Tyr Lys Gly Ser He Gly Val Phe Ala 
20 25 30 

Gly Cys Gly Val Asn Thr Tyr Leu Leu Asn Asn Leu Ala Thr Ala Glu 
35 40 45 

Pro Phe Asp Phe Ser Arg Pro Ser Ala Tyr Gin Leu Leu Thr Ala Asn 
50 55 60 



Asp Lys Asp Phe Leu Ala Thr Arg Val Ser Tyr Lys Leu Asn Leu Arg 
65 70 75 80 
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Gly Pro Ser Leu Thr Val Gin Thr Ala Cys Ser Thr Ser Leu Val Ser 
85 90 95 

Val Val Met Ala Cys Glu Ser Leu Gin Arg Gly Ala Ser Asp lie Ala 
100 105 110 

Leu Ala Gly Gly Val Ala He Asn Val Pro Gin Ser Val Gly Tyr Leu 
115 120 125 

His Gin Pro Gly Met He Leu Ser Pro Asp Gly Arg Cys Arg Ala Phe 
130 135 140 

Asp Glu Ser Ala Gin Gly Thr Val Pro Gly Asn Gly Ala Gly Val Val 
145 150 155 160 

Val Leu Lys Arg Leu Ser Arg Ala Leu Ala Asp Gly Asp Thr He Tyr 
165 170 175 

Ala Val He Arg Gly Ala Ala He Asn Asn Asp Gly Ala Glu Arg Met 
180 185 190 

Gly Phe Thr Ala Pro Gly Val Asp Gly Gin Thr Arg Leu He Arg Arg 
195 200 205 

Thr Gin Glu Met Ala Gly Val Lys Pro Glu Ser He Gly Tyr Met Asp 
210 215 220 



Thr His Gly Thr Gly 
225 



<210> 50 
<211> 223 
<212> PRT 

<213> Organime. Inconnu 
<220> 

<223> Origine de la sequence lorganisme du sol 
<400> 50 

Pro Gin Gin Arg Leu Phe Leu Glu Val Ala Trp Glu Ala Leu Glu Arg 
15 10 15 

Ala Gly Arg Pro Pro Asp Ser Leu Ala Gly Ser Asp Thr Gly Val Phe 
20 25 30 

He Gly He Ser Thr Asp Asp Tyr Ser Arg Leu Lys Pro Thr Asp Pro 
35 40 45 



PCT/FROO/03311 



Ala Leu He Asp Ala Tyr Thr Gly Thr Gly Thr Ala Phe Ser Thr Ala 
50 55 60 

Ala Gly Arg He Ser Tyr Leu Leu Gly Leu Gin Gly Pro Asn Phe Pro 
65 70 75 80 

Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val His Leu Ala Cya 



Arg Ser Leu Gin Ser Arg Glu Cys Ser Met Ala Leu Ala Gly Gly Val 
100 105 110 

Asn Leu He Leu Ala Pro Glu Ser Thr He Tyr Phe Cys Arg Leu Arg 
115 120 125 

Ala Met Ala Ala Asp Gly Arg Cys Lys Ser Phe Ala Ala Ser Ala Asp 
130 135 140 

Gly Tyr Gly Arg Gly Glu Gly Cys Gly Met Leu Val Leu Lys Arg Leu 
145 150 155 160 

Ser Asp Ala Thr Arg Asp Gly Asp Arg He Leu Ala Leu He Arg Gly 
165 170 175 

Ser Ala Val Asn His Gly Gly Arg Ser Asn Gly Leu Thr Ala Pro Asn 
180 185 190 

Gly Pro Ala Gin Glu Ala Val He Arg Ala Ala Leu Lys Asn Ala Gly 
195 200 205 



Met Ala Pro Ala Asp Val Asp Tyr Val Asp Thr His Gly Thr Gly 
210 215 220 



<210> 51 
<211> 252 
<212> PRT 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence torganisrae du sol 
<400> 51 

Pro Gin Glu Arg Val Phe Leu Glu Arg He Asp Gly Phe Asp Ala Glu 
15 10 15 



Phe Phe Gly He Ser Pro Arg Glu Ala Leu Asn Met Asp Pro Gin Gin 
20 25 30 
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Arg Leu Leu Leu Glu Val Cys Trp Glu Ala Ala Glu Aap Ala Gly He 
35 40 45 

Ser Pro Gly Pro Leu Ala Gly Ser Ala Thr Gly Val Phe Ala Gly Ser 
50 55 60 

Cys Ala Gin Asp Phe Gly Leu Phe Gin Tyr Ala Asp Pro Ala Arg He 
65 70 75 80 

Gly Ala Trp Ser Gly Ser Gly Val Ala His Ser Met Leu Ala Asn Arg 
85 90 95 

He Ser Tyr Leu Leu Asp Leu Arg Gly Pro Ser Met Ala Val Asp Thr 
100 105 110 

Ala Cys Ser Ser Ala Leu Val Ala Val His Leu Ala Cys Gin Ser Leu 
115 120 125 

Arg Arg Arg Glu Cys Asp Ala Ala Phe Ala Gly Gly Val Asn Leu He 
130 135 140 

Leu Thr Pro Glu Gly Met He Ala Leu Ser Lys Ala Arg Met Leu Ala 
145 150 155 160 

Pro Asp Gly Arg Cys Lys Thr Phe Asp Ala Ala Ala Asp Gly Tyr Val 
165 170 175 

Arg Gly Glu Gly Cys Gly He Val Leu Leu Lys Arg Leu Ser Asp Ala 
180 185 190 

Leu Ala Asp Gly Asp Ala He Cys Ala Val He Arg Gly Ser Ala He 
195 200 205 

Asn Gin Asp Gly Arg Ser Asn Gly He Thr Ala Pro Asn Leu Gin Ala 
210 215 220 

Gin Lys Ala Val Leu Gin Glu Ala Val Ala Asn Ala His He Asp Pro 
225 230 235 240 

Ser His Val Ser Leu He Asp Thr His Gly Thr Gly 
245 250 



<210> 52 
<211> 234 
<212> PRT 

<213> Organime Inconnu 
<220> 



PCT/FR00/033H 



<223> Origine de la sequence :organisme du sol 
<400> 52 

Pro Gin Gin Arg Val Phe Leu Glu Cys Ala Trp Glu Ala Val Glu Ser 
15 10 15 

Ala Gly Tyr Asp Pro Glu Lys Tyr Pro Gly Leu He Gly Val Phe Ala 
20 25 30 

Gly Ala Ser He Asn Ser Tyr Phe Leu Tyr Asn Leu Ala His Aan Arg 
35 40 45 

Glu Phe Val Ala Arg Met Ala Gly Glu Tyr Gin Val Gly Glu Tyr Gin 
50 55 60 

Thr He Leu Gly Asn Asp Lys Asp Tyr Leu Pro Thr Arg Val Ser Tyr 
65 70 75 80 

Lys Leu Asn Leu Arg Gly Pro Ser Leu Ala Val Gin Ser Ala Cys Ser 
85 90 95 

Thr Gly Leu Val Ala Val Cys Gin Ala He Gin Asn Leu Gin Thr Tyr 
100 105 110 

Gin Cys Asp Met Ala Leu Ala Gly Gly He Ser He Ser Phe Pro Gin 
115 120 125 

Lys Arg Asp Tyr Arg Phe Thr Asp Glu Gly Met Val Ser Arg Asp Gly 
130 135 140 

His Cys Arg Pro Phe Asp Ala Ser Ala Gin Gly Thr Val Phe Gly Asn 
145 150 155 160 

Gly Ala Gly Val Val Leu Met Lys Arg Leu Ala Asp Ala Val Thr Asp 
165 170 175 

Arg Asp Thr He Leu Ala Val He Arg Gly Ala Ala Val Asn Asn Asp 
180 185 190 

Gly Gly Val Lys Met Gly Tyr Thr Ala Pro Ser Ala Glu Gly Gin Ala 
195 200 205 

Glu Ala He Thr Leu Ala Leu Ala Leu Ala Gly Val Ser Pro Glu Thr 
210 215 220 

He Thr Cys Met Asp Thr His Gly Thr Gly 
225 230 
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<210> 53 
<211> 226 
<212> PRT 

<213> Organime Incoraiu 
<220> 

<223> Origine de la sequence :organisme du sol 
<400> 53 

Pro Gin Gin Arg Val Phe Leu Glu Cys Ala Trp Ala Ala Leu Glu Arg 
1 5 10 15 

Arg Arg He Ser Gly Arg His Leu Pro Arg Cys Pro Ser Ala Val Tyr 
20 25 30 

Ala Ser Ser Gly Phe Asn Thr Tyr Leu Leu Aan Leu His Ala Asn Ala 
35 40 45 

Ala Val Arg Gin Ser He Ser Pro Phe Glu Leu Phe Val Ala Asn Asp 
50 55 60 

Lys Asp Phe Leu Ala Thr Arg Thr Ala Tyr Lys Leu Asn Leu Arg Gly 



Pro Ala Met Thr Val Gin Thr Ala Cys Ser Ser Ser Leu Val Ala Val 
85 90 95 

His Val Ala Ala Gin Ser Leu Leu Ala Gly Glu Cys Asp He Ala Leu 
100 105 110 

Ala Gly Gly He Thr Val Ser Arg Ser His Gly Tyr Val Ala Arg Glu 
115 120 125 

Gly Gly He Leu Ser Pro Asp Gly His Cys Arg Ala Phe Asp Ala Asp 
130 135 140 

Ala Gly Gly Thr Val Pro Gly Ser Gly Val Gly Val Val Val Leu Lys 
"5 150 155 160 

Arg Leu Glu Asp Ala Leu Ala Asp Gly Asp Thr He Asp Ala Val He 
165 170 175 

He Gly Ser Ala He Asn Asn Asp Gly Ala Leu Lys Ala Ser Phe Thr 
180 185 190 

Ala Pro Gin Val Asp Ser Gin Ala Leu Val He Ser Glu Ala His Ala 
195 200 205 

Ala Ala Gly He Ser Ala Asp Ser He Gly Tyr Met Asp Thr His Gly 
210 215 220 
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Thr Gly 
225 



<210> 54 
<211> 223 
<212> PRT 

<213> Organime Inconnu 

<220> 

<223> Origine de la sequence : organisms du sol 
<400> 54 

Pro Gin Gin Arg Leu Phe Leu Glu Leu Thr Trp Glu Ala Leu Glu Asp 
15 10 15 

Ala Gly He Pro Pro Ser Thr He Ala Gly Thr Asn Val Gly Val Phe 
20 25 30 

Met Gly Ala Ser Gin Ala Asp Tyr Gly His Lys Phe Phe Ser Asp His 
35 40 45 

Ala Val Ala Asp Ser His Phe Ala Thr Gly Thr Ser Leu Ala Val Val 
50 55 60 

Ala Asn Arg He Ser Tyr He Tyr Asp Leu Arg Gly Pro Ser Leu Thr 
65 70 75 80 

Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Leu His Gin Ala Val 
85 90 95 

Glu Ala Leu Arg Ser Gly Arg He Glu Thr Ala He Val Gly Gly He 
100 105 110 

Asn Val He Ala Ser Pro Ala Ser Phe He Ala Phe Ser Gin Ala Ser 
115 120 125 

Met Leu Ser Pro Thr Gly Leu Cys Gin Ala Phe Ser Ala Lys Ala Asp 
130 135 140 

Gly Phe Val Arg Gly Glu Gly Gly Thr Val Phe Val Leu Arg Lys Ala 
145 150 155 160 

Ala His Ala His Gly Ser Arg Asn Pro Val Arg Gly Leu He Leu Ala 
165 170 175 

Thr Asp Val Asn Ser Asp Gly Arg Thr Asn Gly He Ser Leu Pro Ser 
180 185 190 
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Ala Glu Ala Gin Glu Val Leu Leu Gin Arg Val Tyr Ser Arg Ala Ser 
195 200 205 

He Asp Pro Asn Arg Leu Ala Phe Val Asp Thr His Gly Thr Gly 
210 215 220 



<210> 55 
<2H> 254 
<212> PRT 

<213> Organime Inconnu 
<220> 

<223> Origine de la s€c[uence :organisme du sol 
<400> 55 

Pro Gin Gin Arg Val Phe Leu Asp Gly He Asp Arg Phe Asp Pro Arg 



His Phe Ala He Thr Pro Arg Glu Ala He Ser Met Asp Pro Gin Gin 



Arg Leu Leu Leu Glu Val Thr Trp Glu Ala Leu Glu Arg Ala Gly Val 
35 40 45 

Ala Pro Asp Arg Leu Thr Gly Ser Asp Thr Gly Val Phe He Gly He 



Ser Thr Asn Asp Tyr Gly Gin He Leu Leu Arg Ala Ser Asp Gin He 
65 70 75 80 

Asp Pro Gly Met Tyr Phe Gly Thr Gly Asn Leu Leu Asn Ala Ala Ala 



Gly Afg Leu Ser Tyr Val Leu Gly Leu Gin Gly Pro Ser Met Ala Val 
100 105 110 

Asp Thr Ala Cys Pro Ser Ser Leu Val Ala He His Leu Ala Cys Gin 
115 120 125 

Ser Leu Arg Asn Arg Glu Cys Arg Met Ala Leu Ala Gly Gly Ala Asn 
130 135 140 

Leu Val Leu Val Pro Glu Val Thr Val Asn Cys Cys Arg Ala Lys Met 
145 150 155 160 



Leu Ala Pro Asp Gly Arg Cya Lys Thr 
165 



Phe Asp Ala Ala Ala Asp Gly 
170 175 
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Tyr Val Arg Gly Glu Gly Ala Ala Val lie Val Leu Lys Arg Leu Ser 
180 185 190 

Asp Ala Leu Ala Asp Gly Asp Pro He Val Ala Leu He Arg Gly Ser 
195 200 205 

Ala Val Asn Gin Asp Gly Arg Ser Gly Gly Phe Thr Ala Pro Asn Glu 
210 215 220 

Leu Ala Gin Gin Ala Val He Arg Thr Ala Leu Ala Ala Ala Gly Val 
225 230 235 240 

Ala Ala Ser Asp He Gly Tyr Val Asp Thr His Gly Thr Gly 
245 250 



<210> 56 
<211> 254 
<212> PRT 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :organisme du sol 
<400> 56 

Pro Gin Gin Arg Val Phe Leu Asp Gly He Asp Arg Phe Asp Pro Gin 
15 10 15 

Phe Phe Gly He Ala Pro Arg Glu Ala Ala Gly He Asp Pro Gin Gin 
20 25 30 

Arg Leu Leu Leu Glu Thr Thr Tip Glu Ala Leu Glu Asp Ala Gly Thr 
35 40 45 

Ser Pro Glu Lys Leu Gin Gly Thr Pro Ala Gly Val Phe Val Gly He 
50 55 60 

Asn Ser He Asp Tyr Ala Thr Leu Gin Leu Gin Asn Cys Asp Leu Ala 
65 70 75 80 

Ser He Asp Ala Tyr Ser Leu Ser Gly Ser Ala His Ser He Ala Ala 
85 90 95 

Gly Arg Leu Ala Tyr Val Leu Gly Leu Gin Gly Pro Ala Met Ala Val 
100 105 110 



Asp Thr Ala Cys Ser Ser Ser Leu Val Ala He His Leu Ala Cys Gin 
115 120 125 



PCT/FROO/03311 



Ser Leu Arg Asn Asp Asp Cys Arg Val Ala Val Ala Gly Gly Val His 
130 135 140 

Val Thr Leu Thr Pro He Asn Met Val Val Phe Ser Lys Leu Arg Met 
145 150 155 160 

Leu Ala Ala Asp Gly Lys Cys Lys Thr Phe Asp Gly Arg Gly Asp Gly 
165 170 175 

Phe Val Glu Gly Glu Gly Cys Ala Val He Val Leu Lys Arg Leu Ser 
180 185 190 

His Ala Leu Ala Asp Lys Asp Arg He Leu Ala Leu Val Arg Gly Ser 
195 200 205 

Ala Val Asn Gin Asp Gly Ala Ser Ser Gly Leu Thr Ala Pro Asn Gly 
210 215 220 

Pro Ala Gin Glu Ala Val He Arg Ala Ala Leu Lys Arg Ala Gly Val 
225 230 235 240 

Gin Pro Ala Glu Val Gly Tyr Val Asp Thr His Gly Thr Gly 
245 250 



<210> 57 
<211> 222 
<212> PRT 

<213> Organirae Inconnu 
<220> 

<223> Origine de la sequence :organisme du sol 
<400> 57 

Pro Gin Glu Arg Val Leu Leu Glu Ser Ser Trp His Ala Leu Glu Asp 
1 5 10 ■ 15 

Ala Gly Tyr Ala Gly Glu Ser He Ala Gly Ala Arg Cys Gly Val Tyr 
20 25 30 

Met Gly Phe Asn Gly Gly Asp Tyr Gly Asp Leu Leu Tyr Gly Gin Pro 



Ser Leu Pro Pro His Ala Met Trp Gly Asn Ala Ala Ser Val Leu Ser 
50 55 60 

Ala Arg He Ala Tyr Tyr Leu Asp Leu Gin Gly Pro Ala He Thr Leu 
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Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val His Leu Ala Cys Gin 
85 90 95 

Gly Leu Trp Thr Gly Glu Thr Asp Leu Ala Leu Ala Gly Gly Val Trp 
100 105 110 

He Gin Cys Thr Pro Gly Phe Leu He Ser Ser Ser Arg Ala Gly Met 
115 120 125 

Leu Ser Pro Thr Gly Gin Cys Arg Ala Phe Gly Ala Gly Ala Asp Gly 
130 135 140 

Phe Val Pro Ser Glu Gly Val Gly Val Val Val Leu Lys Arg Leu Gin 
145 150 155 160 

Asp Ala Leu Asp Ala Gly Asp His Xaa Tyr Gly Val He Arg Gly Ser 
165 170 175 

Ala He Asn Gin Asp Gly Ala Ser Asn Gly He Thr Ala Pro Ser Ala 
180 185 190 

Ala Ala Gin Glu Arg Leu Gin Arg His Val Tyr Asp Ser Phe Gly He 
195 200 205 

Asp Ala Ser Arg Leu Gin Met He Glu Ala His Gly Thr Gly 
210 215 220 



<210> 58 
<211> 223 
<212> PRT 

<213> Organime Znconnu 
<220> 

<223> Origine de -la sequence :organisrae du sol 
<400> 58 

Pro Gin Glu Arg Val Leu Leu 
1 5 

Ala Gly Gin Asp Val Asp Arg 
20 

Val Gly He Ser Ser Asn Asp 
35 



Glu Val Thr Trp Glu Ala Leu Glu Asp 
10 15 

Leu Ala Gly Arg Pro Val Gly Val Phe 
25 30 

Tyr Gly Gin Leu Gin Asn Gly Asp Pro 
40 45 



Ala Asp Val Asp Ala Tyr Val 
SO 55 



Gly Thr 



Gly Asn Ala Leu Ser He Ala 
60 
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Ala Asn Arg Leu Ser Tyr Thr Phe Asp Phe Arg Gly Pro Ser Leu Ala 
65 70 75 80 



Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala lie His Leu Ala Cys 



Gin Ser Val Arg Arg Gly Glu Ala Glu Leu Ala Val Ala Ala Gly Val 
100 105 110 



Asn Leu lie Leu Thr Pro Gly Leu Thr Val Asn Phe Thr Arg Ala Gly 
115 120 ' 125 



Met Met Ala Pro Asp Gly Arg Cys Lys Thr Phe Asp Ala Ala Ala Asn 
130 135 140 



Gly Tyr Val Arg Gly Glu Gly Ala Gly Val Val Val Leu Lys Pro Leu 
145 150 155 160 



Ala Gin Ala He Ala Asp Gly Asp Pro lie Tyr Ala He Val Arg Gly 
165 170 175 



Ser Ala Val Asn Gin Asp Gly Arg Ser Asn Gly Leu Thr Ala Pro Asn 
180 185 190 



Arg Gin Ala Gin Glu Val Val Leu Arg Ala Ala Tyr Arg Asp Ala Gly 
195 200 205 



He Ser Pro Ala Asp Val Asp Ala Val Glu Ala His Gly Thr Gly 
210 215 220 



<210> 59 
<211> 235 
<212> PRT 

<213> Organime Inconnu 

<220> 

<223> Origins de la sequence :organisrae du sol 
<400> 59 

Pro Gin Gin Arg Val Phe Leu Glu Asp Ala Thr Glu Val Asp Val Asp 
15 10 15 • 

Ala Leu Ser Asp Gly Glu Asp Val Val He Ala Gly He Met Gin His 
20 25 30 



He Glu Glu Ala Gly He His Ser Gly Asp Ser Ser Cys Val Leu Pro 
35 40 45 



PCT/FR0O/O33n 



Pro Val Asp lie Pro Pro Lys Ala Leu Gin Thr He Arg Asp His Thr 
50 55 60 

Phe Lys Leu Ala Arg Ala Leu Lys Val He Gly Leu Met Asn Val Gin 
65 70 75 80 

Tyr Ala He Gin Arg Asp Lys Val Tyr Val He Glu Val Asn Pro Arg 
85 90 95 

Ala Ser Arg Thr Val Pro Tyr Val Ser Lys Ala Thr Gly Val Pro Leu 
100 105 110 

Ala Lys Val Ala Ser Arg Leu Met Thr Gly Arg Lys Leu His Glu Leu 
115 120 125 

Leu Pro Glu Gly Val Glu Arg Gly Trp He Thr Thr Ala Gly Glu Asn 
130 135 140 

Phe Tyr Val Lys Ser Pro Val Phe Pro Trp Gly Lys Phe Pro Gly Val 
145 ISO 155 160 

Asp Thr Val Leu Gly Pro Glu Met Lys Ser Thr Gly Glu Val Met Gly 
165 170 175 

Val Ala Asp Asn Phe Gly Glu Ala Phe Ala Lys Ala Gin He Ala Ala 
180 185 190 

Gly Thr Tyr Leu Pro Thr Glu Gly Thr Val Phe He Ser Val Asn Asp 
195 200 205 

Arg Aap Lys Gly Asn Val He Gin Leu Ala Gin Arg Phe Ser Glu Leu 
210 215 220 

Gly Phe Gly He Val Asp Thr His Gly Thr Gly 
225 230 235 



<210> 60 
<211> 1269 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence rOrganisme du sol 
<400> 60 

taacaggaag aagcttgctt ctttgctgac gagtggcgga cgggtgagta acacgtggga 60 
acctgcctta tggttcggga taacgtctgg aaacggacgc taacaccgga tgtgcccttc 120 
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gggggaaagt ttacgccatg agaggggccc 
gcccaccaag ccgacgatcg gtagctggtc 
gacacggccc agactcctac gggaggcagc 
ctgatccagc aatgccgcgt gagtgatgaa 
cgacgatgat gacggtagcg tgagaagaag 
taatacgaag ggggcgagcg ttgttcggaa 
cgatcagtca gatgtgaaag ccccgggctc 
cttgagttcc ggagaggatg gtggaattcc 
gaagaacacc ggtggcgaag gcggccatct 
gtggggagca aacaggatta gataccctgg 
cgctggggtg catgcacttc ggtgtcgccg 
acggccgcaa ggttaaaact caaaggaatt 
tggtttaatt cgaagcaacg cgcagaacct 
cgagagattg gaccttcagt tcggctggat 
ctcgtgtcgt gagatgttgg gttaagtccc 
catcattcag ttgggcactc tggtggaact 
gacgtcaagt cctcatggcc cttatgggtt 
agtgggacgc gaagtcgcaa gatggagcaa 
actctgcaac tcgggtgcat gaagttggaa 
gtgaatacg 



gcgtccgatt aggtagttgg tggggtaatg 180 
tgagaggatg atcagccaca ctgggactga 240 
agtggggaat attggacaat gggggcaacc 300 
ggccttaggg ttgtaaagct ctttcgcacg 360 
ccccggctaa cttcgtgcca gcagccgcgg 420 
ttactgggcg taaagggcgc gtaggcggcc 480 
aacctgggaa ctgcatttga tactgtcggg 540 
cagtgtagag gtgaaattcg tagatattgg 600 
ggacggacac tgacgctgag gcgcgaaagc 660 
tagtccacgc cgtaaacgat gaatgctaga 720 
ctaacgcatt aagcattccg cctggggagt 780 
gacgggggcc cgcacaagcg gtggagcatg 840 
taccaaccct tgacatgtcc attgccggtc 900 
ggaacacagg tgctgcatgg ctgtcgtcag 960 
gcaacgagcg caacccctac cgccagttgc 1020 
gccggtgaca agccggagga aggcggggat 1080 
gggctacaca cgtgctacaa tagcggtgac 1140 
atccccaaaa gccgtctcag ttcggattgc 1200 
tcgctagtaa tcgcggatca gcacgccgcg 1260 
1269 



<210> 61 
<211> 1500 
<212> AON 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organlsme du sol 
<400> 61 

ttttaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggccctct 60 
agatgcatgc tcgagcggcc gccagtgtga tggatatctg cagaattcgc ccttcaggcc 120 
taacacatgc aagtcgaacg agggcttcgg ccctagtggc gcacgggtga gtaacacgtg 180 
ggaacctgcc ttatggttcg ggataacgtc tggaaacgga cgctaacacc ggatgtgccc 24 0 
ttcgggggaa agtttacgcc atgagagggg cccgcgtccg attaggtagt tggtggggta 300 
atggcccacc aagccgacga tcggtagctg gtctgagagg atgatcagcc acactgggac 360 
tgagacacgg cccagactcc tacgggaggc agcagtgggg aatattggac . aatgggggca 420 
accctgatcc agcaatgccg cgtgagtgat gaaggcctta gggttgtaaa gctctttcgc 480 
acgcgacgat gatgacggta gcgtgagaag aagccccggc taacttcgtg ccagcagccg 540 
cggtaatacg aagggggcga gcgttgttcg gaattactgg gcgtaaaggg cgcgtaggcg 600 
gcccgatcag tcagatgtga aagccccggg ctcaacctgg gaactgcatt tgatactgtc 660 
gggcttgagt tccggagagg atggtggaat tcccagtgta gaggtgaaat tcgtagatat 720 
tgggaagaac accggtggcg aaggcggcca tctggacgga cactgacgct gaggcgcgaa 780 
agcgtgggga gcaaacagga ttagataccc tggtagtcca cgccgtaaac gatgaatgct 840 
agacgctggg gtgcatgcac ttcggtgtcg ccgctaacgc attaagcatt ccgcctgggg 900 
agtacggccg caaggttaaa actcaaagga attgacgggg gcccgcacaa gcggtggagc 960 
atgtggttta attcgaagca acgcgcagaa ccttaccaac ccttgacatg tccattgccg 1020 
gtccgagaga ttggaccttc agttcggctg gatggaacac aggtgctgca tggctgtcgt 1080 
cagctcgtgt cgtgagatgt tgggttaagt cccgcaacga gcgcaacccc taccgccagt 1140 
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tgccatcatt cagttgggca ctctggtgga 
gatgacgtca agtcctcatg gcccttatgg 
gacagtggga cgcgaagtcg caagatggag 
tgcactctgc aactcgggtg catgaagttg 
gcggtgaata cgttcccggg ccttgtacac 
cggccgttac tagtggatcc gagctcggta 



actgccggtg acaagccgga ggaaggcggg 1200 
gttgggctac acacgtgcta caatggcggt 1260 
caaatcccca aaagccgtct cagttcggat 1320 
gaatcgctag taatcgcgga tcagcacgcc 1380 
accgcccaag ggcgaattcc agcacactgg 1440 
ccaagcttgg cgtaatcatg gtcatagctg 1500 



<210> 62 
<211> 1366 
<212> ADN 

<213> Organime Inconnu 



<220> 

<223> Origine de la s§quence :Organisme du sol 



<400> 62 

acgacggcca gtgaattgta atacgactca 
tgctcgagcg gccgccagtg tgatggatat 
tgcaagtcga acgaaggctt cggccttagt 
gcctttcggt tcggaataac gtctggaaac 
gaaagttcac gccgagagag gggcccgcgt 
accaagcctt cgatccgtag ctggtctgag 
cggcccagac tcctacggga ggcagcagtg 
tccagcaatg ccgcgtgagt gatgaaggcc 
gatgatgacg gtagcgtgag aagaagcccc 
acgaaggggg ctagcgttgt tcggaattac 
tagtcagaag tgaaagcccc gggctcaacc 
agttccggag aggatggtgg aattcccagt 
aacaccggtg gcgaaggcgg ccatctggac 
ggagcaaaca ggattagata ccctggtagt 
ggggtgcatg cacttcggtg tcgccgctaa 
ccgcaaggtt aaaactcaaa ggaattgacg 
ttaattcgaa gcaacgcgca gaaccttacc 
agatgaggtc cttcagttcg gctgggtgga 
gtgtcgtgag atgttgggtt aagtcccgca 
cattcagttg ggcactctgg tggaaccgcc 
gtcaagtcct catggccctt atgggttggg 
gggaagcgaa gtcgcgagat ggagcaaatc 
ctgcaactcg agtgcgtgaa gttggaatcg 



ctatagggcg aattgggccc tctagatgca 60 
ctgcagaatt cgcccttcag gcctaacaca 120 
ggcgcacggg tgagtaacac gtgggaacct 180 
ggacgctaac accggatacg cccttcgggg 240 
cggattaggt agttggtgag gtaatggctc 300 
aggatgatca gccacactgg gactgagaca 360 
gggaatattg gacaatgggc gcaagcctga 420 
ttagggttgt aaagctcttt cgcacgcgac 480 
ggctaacttc gtgccagcag ccgcggtaat 540 
tgggcgtaaa gggcgcgtag gcggcctgct 600 
tgggaatagc ttttgatact ggcaggcttg 660 
gtagaggtga aattcgtaga tattgggaag 720 
ggacactgac gctgaggcgc gaaagcgtgg 780 
ccacgccgta aacgatgaat gctagacgtc 840 
cgcattaagc attccgcctg gggagtacgg 900 
ggggcccgca caagcggtgg agcatgtggt 960 
aacccttgac atgtccatta tgggcttcag 1020 
acacaggtgc tgcatggctg tcgtcagctc 1080 
acgagcgcaa cccctaccgt cagttgccat 1140 
ggtgacaagc cggaggaagg cggggatgac 1200 
ctacacacgt gctacaatgg cggtgacagt 1260 
cccaaaagcc gtctcagttc ggatcgcact 1320 
ctagtaatcg cggatc 1366 



<210> 63 
<211> 1360 
<212> ADN 

<213> Organime Inconnu 



<220> 

<223> Origine de la sequence :Organisme du sol 
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<400> 63 

acagctatga ccatgattac gccaagcttg 
gccagtgtgc tggaattcgc ccttcaggcc 
ggagtggcag acgggtgagt aacgcgtggg 
gaaactggaa ttaataccgc atacgcccta 
cccgcgttgg attagctagt tggtggggta 
gtctgagagg atgatcagcc acattgggac 
agcagtgggg aatattggac aatgggcgca 
gaaggcctta gggttgtaaa gctctttcac 
aagccccggc taacttcgtg ccagcagccg 
gaattactgg gcgtaaagcg cacgtaggcg 
ctcaactctg gaactgcctt tgatactggg 
tccgagtgta gaggtgaaat tcgtagatat 
actggtccat tactgacgct gaggtgcgaa 
tggtagtcca cgccgtaaac gatgaatgtt 
cagctaacgc attaaacatt ccgcctgggg 
attgacgggg gcccgcacaa gcggtggagc 
ccttaccagc tcttgacatt cggggtttgg 
ggccccagaa caggtgctgc atggctgtcg 
tcccgcaacg agcgcaaccc tcgcccttag 
gactgccggt gataagccga gaggaaggtg 
gggctgggct acacacgtgc tacaatggtg 
agctaatctc caaaagccat ctcagttcgg 
tggaatcgct agtaatcgca gatcagcatg 



gtaccgagct cggatccact agtaacggcc 60 
taacacatgc aagtcgaacg ccccgcaagg 120 
aacataccct ttcctgcgga atagctccgg 180 
cgggggaaag atttatcggg gaaggattgg 240 
aaggcctacc aaggcgacga tccatagctg 300 
tgagacacgg cccaaactcc tacgggaggc 360 
agcctgatcc agccatgccg cgtgagtgat 420 
cggagaagat aatgacggta tccggagaag 480 
cggtaatacg aagggggcta gtgttgttcg 540 
gatatttaag tcaggggtga aatcccagag 600 
tatcttgagt atggaagagg taagtggaat 660 
tcggaggaac accagtggcg aaggcggctt 720 
agcgtgggga gcaaacagga ttagataccc 780 
agccgtcggg cagtatactg ttcggtggcg 840 
agtacggtcg caagattaaa actcaaagga 900 
atgtggttta attcgaagca acgcgcagaa 960 
gcagtggaga cattgtcctt cagttaggct 1020 
tcagctcgcg tcgtgagatg ttgggttaag 1080 
ttgccagcat ttagttgggc actctaaggg 1140 
gggacgacgt caagtcctca tggcccttac 1200 
gtgacagtgg gcagcgagac agcgatgtcg 1260 
attgcactct gcaactcgag tgcatgaagt 1320 
tgcggtgaat 1360 



<210> 64 
<211> 1288 
<212> ADN 

<213> Organime Inconnu 



<220> 

<223> Origine de la sequence :Organisme du sol 



<400> 64 

tccaggaaac agctatgacc atgattacgc 
taacggccgc cagtgtgctg gaattcgccc 
ccgcaagggg agcggcagac gggtgagtaa 
aactccggga aactggagct aataccgtat 
tggatgagcc cgcgttggat tagctagttg 
catagctggt ctgagaggat gatcagccac 
cgggaggcag cagtggggaa tattggacaa 
gtgagtgatg aaggtcttag gattgtaaag 
ccggagaaga agccccggct aactttcgtg 
gcgttgttcg gaattactgg gcgtaaagcg 
aatcccagag ctcaactctg gaactgcctt 
taagtggaat tgcgagtgta gaggtgaaat 
aaggcggctt actggtccat tactgacgct 
ttagataccc tggtagtcca cgccgtaaac 
gtcggtggcg cagctaacgc attaaacatt 



caagcttggt accgagctcg gatccactag 60 
ttcaggccta acacatgcaa gtcgagcgcc 120 
cgcgtgggaa tctacccatc cctacggaac 180 
acgccctttg ggggaaagat ttatcgggga 240 
gtggggtaaa ggcctaccaa ggcgacgatc 300 
attgggactg agacacggcc caaactccta 360 
tgggcgcaag cctgatccag ccatgcccgc 420 
ctctttcacc ggagaagata atgacggtat 480 
ccagcagccg cggtaatacg aagggggcta 540 
cacgtaggcg gatatttaag tcaggggtga 600 
tgatactggg tatcttgagt atggaagagg 660 
tcgtagatat tcgcaggaac accagtggcg 720 
gaggtgcgaa agcgtgggga gcaaacagga 780 
gatgaatgtt agccgtcggc aagtttactt 840 
ccgcctgggg agtacggtcg caagattaaa 900 
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actcaaagga attgacgggg gcccgcacaa 

acgcgcagaa ccttaccagc ccttgacatg 

ttcggggacc gggacacagg tgctgcatgg 

gttaagtccc gcaacgagcg caaccctcgc 

taaggggact gccggtgata agccgagagg 

cttacgggct gggctacaca cgtgctacaa 

atcccgagct aatctccaaa agccatct 



gcggtggagc atgtggttta attcgaagca 960 
cccggacagc tacagagatg tagtgttccc 1020 
ctgtcgtcag ctcgtgtcgt gagatgttgg 1080 
ccttagttgc cagcattcag ttgggcactc 1140 
aagtggggat gacgtcaagt cctnatggcc 1200 
tgggtggtga cagtgggcag cgaaggaacg 1260 
1288 



<210> 65 
<211> 1386 
<212> ADN 

<213> Organime Inconnu 



<220> 

<223> Origine de la sequence :Organisme du sol 



<400> 65 

cgacggccag tgaattgtaa tacgactcac 
gctcgagcgg ccgccagtgt gatggatatc 
gcaagtcgag cgggcgtagc aatacgtcag 
taccttttgg ttcggaacaa cacagggaaa 
ggaaagattt atcgccgaaa gattggcccg 
cctaccaagg cgacgatcag tagctggtct 
acacggccca aactcctacg ggaggcagca 
tgatccagcc atgccgcgtg agtgatgaag 
gaagataatg acggtaccgc aagaataagc 
aatacgaagg gggctagcgt tgctcggaat 
tttaagtcag gggtgaaatc ctggagctca 
ttgagttcgg gagaggtgag tggaactgcg 
aagaacacca gtgggcgaag gcggctcact 
gtggggagca aacaggatta gataccctgg 
cgttagtggg tttactcact agtggcgcag 
acggtcgcaa gattaaaact caaaggaatt 
tggtttaatt cgacgcaacg cgcagaacct 
gcagagatgt gaccttctct tcggagcctg 
tcgtgtcgtg agatgttggg ttaagtcccg 
accatttagt tgagcactct aaggagactg 
gacgtcaagt cctcatggcc cttacgggct 
aatgggacgc taaggggcaa cccttcgcaa 
ggctctgcaa ctcgagccca tgaagttgga 
ggtgaa 



tatagggcga attgggccct ctagatgcat 60 
tgcagaattc gcccttcagg cctaacacat 120 
cggcagacgg gtgagtaacg cgtgggaaca 180 
cttgtgctaa taccggataa gcccttacgg 240 
cgtctgatta gctagttggt agggtaatgg 300 
gagaggatga tcagccacat tgggactgag 360 
gtggggaata ttggacaatg ggcgcaagcc 420 
gccctagggt tgtaaagctc ttttgtgcgg 480 
cccggctaac ttcgtgccag cagccgcggt 540 
cactgggcgt aaagggtgcg taggcgggtc 600 
actccagaac tgcctttgat actgaagatc 660 
agtgtagagg tgaaattcgt agatattcgc 720 
ggcccgatac tgacgctgag gcacgaaagc 780 
tagtccacgc cgtaaacgat gaatgccagc 840 
ctaacgcttt aagcattccg cctggggagt 900 
gacgggggcc cgcacaagcg gtggagcatg 960 
taccagccct tgacatgtcc aggaccggtc 1020 
gagcacaggt gctgcatggc tgtcgtcagc 1080 
caacgagcgc aacccccgtc cttagttgct 1140 
ccggtgataa gccgcgagga aggtggggat 1200 
gggctacaca cgtgctacaa tggcggtgac 1260 
atctcaaaaa gcccgtctca gttcggattg. 1320 
atcgctagta atcgtggatc agcacgccac 1380 
1386 



<210> 66 
<211> 1223 
<212> ADN 

<213> Organime Inconnu 



<220> 
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<223> Origine de la sequence :0r< 
<400> 66 

agcggcagag ggtgagtaac gcgtgggaat 
actggagcta ataccgtata cgtccttcgg 
gcgttggatt agctagttgg tggggtaatg 
tgagaggatg atcagccaca ctgggactga 
agtggggaat attggacaat gggcgaaagc 
ggccctaggg ttgtaaagct ctttcaacgg 
ccccggctaa cttcgtgcca gcagccgcgg 
ttactgggcg taaagcgcac gtaggcggac 
aaccccggaa ctgcctttga tactggtagt 
gagtgtagag gtgaaattcg tagatattcg 
ggtccggtac tgacgctgag gtgcgaaagc 
tagtccacgc cgtaaacgat ggaagctagc 
ctaacgcatt aagcttcccg cctggggagt 
gacgggggcc cgcacaagcg gtggagcatg 
taccagccct tgacatcccg gtcgcggtta 
ccggtgacag gtgctgcatg gctgtcgtca 
cgcaacgagc gcaaccctcg cccttagttg 
tgccggtgat aagccgagag gaaggtgggg 
ctgggctaca cacgtgctac aatggtggtg 
taatctccaa aagccatctc agttcggatt 
aatcgctagt aatcgcggat cag 



du sol 



ctacccatct ctacggaaca actccgggaa 60 
gagaaagatt tatcggagat ggatgagccc 120 
gcctaccaag gcgacgatcc atagctggtc 180 
gacacggccc agactcctac gggaggcagc 240 
ccgatccagc catgccgcgt gagtgatgaa 300 
tgaggataat gacggtaacc gtagaagaag 360 
taatacgaag ggggctagcg ttgttcggaa 420 
tattaagtca ggggtgaaat cccggggctc 480 
ctcgagtccg gaagaggtga gtggaattcc 540 
gaggaacacc agtggcgaag gcggctcact 600 
gtggggagca aacaggatta gataccctgg 660 
cgttggcaag tttacttgtc ggtggcgcag 720 
acggtcgcaa gattaaaact caaaggaatt 780 
tggtttaatt cgaagcaacg cgcagaacct 840 
ccagagatgg tatccttcag ttcggctgga 900 
gctcgtgtcg tgagatgttg ggttaagtcc 960 
ccagcattca gttgggcact ctaaggggac 1020 
atgacgtcaa gtcctcatgg cccttacggg 1080 
acagtgggca gcgagaccgc gaggtcgagc 1140 
gcactctgca actcgagtgc atgaagttgg 1200 
1223 



<210> 67 
<211> 1237 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 67 

cccgcagggg agtggcagag ggtgagtaac gcgtgggaat ctaccctttt ctacggaaca 60 
actgagggaa acttcagcta ataccgtata cggccgagag gcgaaagatt tatcggagaa 120 
ggatgagccc gcgttggatt agctagttgg tggggtaaag gcctaccaag gcgacgatcc 180 
atagctggtc tgagaggatg atcagccaca ctgggactga gacacggccc agactcctac 240 
gggaggcagc agtggggaat attggacaat gggcgcaagc ctgatccagc catgccgcgt 300 
gagtgatgaa ggccctaggg ttgtaaagct ctttcaccgg tgaagataat gacggtaacc 360 
ggagaagaag ccccggctaa cttcgtgcca gcagccgcgg taatacgaag ggggctagcg 420 
ttgttcggat ttactgggcg taaagcgcac gtaggcggac tattaagtca ggggtgaaat 480 
cccggggctc aaccccggaa ctgcctttga tactggtagt cttgagttcg aaagaggtga 540 
gtggaattcc gagtgtagag gtgaaattcg tagatattcg gaggaacacc agtggcgaag 600 
gcggctcact ggctcgatac tgacgctgag gtgcgaaagc gtggggagca aacaggatta 660 
gataccctgg tagtccacgc cgtaaactat gagagctagg cgtcgggcag tatactgttc 720 
ggtggcgcag ctaacgcatt aagctcttcg cctggggagt acggtcgcaa gattaaaact 780 
caaaggaatt gacgggggcc cgcacaagcg gtggagcatg tggtttaatt cgaagcaacg 840 
cgcagaacct taccagccct tgacatcccg atcgcggtta ccagagatgg tatccttcag 900 
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ttaggctgga tcggtgacag gtgctgcatg gctgtcgtca gctcgtgtcg tgagatgttg 960 
ggttaagtcc cgcaacgagc gcaaccctcg cccttagttg ccatcattca gttgggcact 1020 
ctaaggggac tgccggtgat aagccgagag gaaggtgggg atgacgtcaa gtcctcatgg 1080 
cccttacggg ctgggctaca cacgtgctac aatggtggcg acagtgggca gcgagaccgc 1140 
gaggtcgagc taatctccaa aagccatctc agttcggatt gcactctgca actcgagtgc 1200 
atgaagttgg aatcgctagt aatcgtggat cagaatg 1237 



<210> 68 
<211> 1346 
<212> ADN 

<213> Organirae Inconnu 
<220> 

<223> Origine de la sequence :Organisnie du sol 
<400> 68 

acgacgggcc agtgaattgt aatacgactc actatagggc gaattgggcc ctctagatgc 60 
atgctcgagc ggccgccagt gtgatggata tctgcagaat tcgcccttca ggcctaacac 120 
atgcaagtcg aacggatccc ttcggattag tggcggacgg gtgagtaaca cgcgggaacg 180 
tgccctttgg ttcggaacaa ctcagggaaa cttgagctaa taccggataa gcctttcgag 240 
ggaaagattt atcgccattg gagcggcccg cgtaggatta gctagttggt gaggtaaaag 300 
ctcaccaagg cgacgatcct tagctggtct gagaggatga tcagccacat tgggactgag 360 
acacggccca aactcctacg ggaggcagca gtggggaatc ttgcgcaatg ggcgaaagcc 420 
tgacgcagcc atgccgcgtg aatgatgaag gtcttaggat tgtaaaattc tttcaccggg 480 
gacgataatg acggtacccg gagaagaagc cccggctaac ttcgtgccag cagccgcggt 540 
aatacgaagg gggctagcgt tgctcggaat tactgggcgt aaagggagcg taggcggata 600 
gtttagtcag aggtgaaagc ccagggctca accttggaat tgcctttgat actggctatc 660 
ttgagtacgg aagaggtatg tggaactccg agtgtagagg tgaaattcgt agatattcgg 720 
aagaacacca gtggcgaagg cgacatactg gtccgttact gacgctgagg ctcgaaagcg 780 
tggggagcaa acaggattag ataccctggt agtccacgct gtaaacgatg agtgctagtt 840 
gtcggcatgc atgcatgtcg gtggcgcagc taacgcatta agcactccgc ctggggagta 900 
cggtcgcaag attaaaactc aaaggaattg acgggggccc gcacaagcgg tggagcatgt 960 
ggtttaattc gaagcaacgc gcagaacctt accacctttt gacatgcccg gaccgctcca 1020 
gagatggagc tttcccttcg gggactggga cacaggtgct gcatggctgt cgtcagctcg 1080 
tgtcgtgaga tgttgggtta agtcccgcaa cgagcgcaac cctcgctatt agttgccatc 1140 
aggtttggct gggcactcta ataggaccgc cggtggtaag ccggaggaag gtggggatga 1200 
cgtcaagtcc tcatggccct tacaaggtgg gctacacacg tgctacaatg gcgactacag 1260 
agggctgcaa tcccgcgagg gggagccaat ccctaaaagt cgtctcagtt cggattgcac 1320 
tctgcaactc gagtgcatga agttgg 1346 



<210> 69 
<211> 1500 
<212> AON 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
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<400> 69 

acagctaCga ccatgattac gccaagcttg 
gccagtgtgc tggaattcgc ccttcaggcc 
acggagtggc agacgggtga gtaacacgtg 
gggaaacttg tgctaatacc gaataagccc 
ggcccgcgtc tgattagcta gttggtgggg 
tggtctgaga ggatgatcag ccacactggg 
gcagcagtta ggaatcttgg acaatgggcg 
atgaaggcct tagggttgta aagctctttc 
agaagccccg gctaacttcg tgccagcagc 
cggaatcact gggcgtaaag cgcacgtagg 
agctcaactc cagaactgcc tttgatactg 
actccgagtg tagaggtgaa attcgtagat 
tcactggtcc ggtactgacg ctgaggtgcg 
cctggtagtc- cacgccgtaa acgatggatg 
cgcagctaac gcattaagca tcccgcctgg 
gaattgacgg gggcccgcac aagcggtgga 
aaccttacca gcccttgaca tgtcccgtat 
ctggcgggaa cacaggtgct gcatggctgt 
agtcccgcaa cgagcgcaac cctcgccctt 
gggactgccg gtgataagcc gcgaggaagg 
acgggctggg ctacacacgt gctacaatgg 
tgcgcaaatc tcaaaaagcc gtctcagttc 
gtcggaatcg ctagtaatcg cagatcagca 
acacaccgcc caagggcgaa ttctgcagat 
catctagagg gcccaattcg ccctatagtg 



gtaccgagct cggatccact agtaacggcc 60 
taacacatgc aagtcgaacg ccgtagcaat 120 
ggaacgtgcc ctttggttcg gaacaacaca 180 
ttacggggaa agatttatcg ccaaaggatc 240 
taacggccca ccaaggctac gatcagtagc 300 
actgagacac ggcccagact cctacgggag 360 
caagcctgat ccagccatgc cgcgtgagtg 420 
agcggggaag ataatgacgg taoccgcaga 480 
cgcggtaata cgaagggggc tagcgttgct 540 
cggatcttta agtcaggggt gaaatcctgg 600 
gggatctcga gtccggaaga ggtgagtgga 660 
attcggaaga acaccagtgg cgaaggcggc 720 
aaagcgtggg gagcaaacag gattagatac 780 
ctagccgttg gcgggtttac tcgtcagtgg 840 
ggagtacggt cgcaagatta aaactcaaag 900 
gcatgtggtt caattcgaag caacgcgcag 960 
ggacttcaga gatgaggtcc ttcagttcgg 1020 
cgtcagctcg tgtcgtgaga tgttgggtta 1080 
agttgccatc atttagttgg gcactctaag 1140 
tggggatgac gtcaagtcct catggccctt 1200 
cggtgacagt gggacgcaat ggagcaatcc 1260 
ggattggggt ctgcaactcg accccatgaa 1320 
cgctgcggtg aatacgttcc cgggccttgt 1380 
atccatcaca ctggcggccg ctcgagcatg 1440 
agtcgtatta caattcactg gccgtcgttt 1500 



<210> 70 
<211> 1113 
<212> ADN 

<213> Orgeuiime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 70 

gagctaatac cgtataatga cttcggtcca aagatttatc gcctgaggat gagcccgcgt 60 

cggattagct agttggtagg gtaaaagcct accaaggcga cgatccgtag ctggtctgag 120 

aggatgatca gccacactgg gactgagaca cggcccagac tcctacggga ggcagcagtg 180 

gggaatattg gacaatgggc gcaagcctga tccagcaatg ccgcgtgagt gatgaaggcc 240 

ttagggttgt aaagctcttt tacccgggaa gataatgact gtaccgggag aataagcccc 300 

ggctaactcc gtgccagcag ccgcggtaat acggaggggg ctagcgttgt tcggaattac 360 

tgggcgtaaa gcgcacgtag gcggctttgt aagttagagg tgaaagcccg gggctcaact 420 

ccggaattgc ctttaagact gcatcgctcg aattgtggag aggtaagtgg aattccgagt 480 

gtagaggtga aattcgtaga tattcggaag aacaccagtg gcgaaggcga cttactggac 540 

acatattgac gctgaggtgc gaaagcgtgg ggagcaaaca ggattagata ccctggtagt 600 

ccacgccgta aacgatgatg actagctgtc ggggcgctta gcgtttcggt ggcgcagcta 660 

acgcgttaag tcatccgcct ggggagtacg gccgcaaggt taaactcaaa gaaattgacg 720 

ggggcctgca caagcggtgg agcatgtggt ttaattcgaa gcaacgcgca gaaccttacc 780 
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agcgtttgac atgccaggac ggtttccaga 
acaggtgctg catggctgtc gtcagctcgt 
gagcgcaacc ctcgtcttta gttgctacca 
tgataagccg gaggaaggtg gggatgacgt 
acacacgtgc tacaatggcg gtgacaacgg 
gaaaagccgt ctcagttcgg attgttctct 



gatggattcc ttcccttacg ggacctggac 840 
gtcgtgagat gttgggttaa gtcccgcaac 900 
tttagttgag cactctagag aaactgccgg 960 
caagtcctca tggcccttac gcgctgggct 1020 
gcagcaaact cgcgagagtg agcaaatccc 1080 
9ca 



<210> 71 
<211> 1225 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 71 

ggagcggcgg acgggtgagt aacgcgtggg aacgtgccct ttggtacgga acaactgagg 60 
gaaacttcag ctaataccgt atgtgccctt cgggggaaag atttatcgcc attggagcgg 120 
cccgcgttgg attaggtagt tggtggggta aaggcctacc aagcctacga tccatagctg 180 
gtctgagagg atgatcagcc acactgggac tgagacacgg cccagactcc tacgggaggc 240 
agcagtaggg aatcttgcgc aatgggcgaa agcctgacgc agccatgccg cgtgtatgat 300 
gaaggtctta ggattgtaaa atactttcac cggggaagat aatgacggta cccggagaag 360 
aagccccggc taacttcgtg ccagcagccg cggtaatacg aagggggcta gcgttgctcg 420 
gaattactgg gcgtaaaggg cgcgtaggcg gatatttaag tcgggggtga aagcccaggg 480 
ctcaaccctg gaattgcctt cgatactgga tatcttgagt tcgggagagg tgagtggaat 540 
gccgagtgta gaggtgaaat tcgtagatat tcggcggaac accagtggcg aaggcgactc 600 
actggcccga tactgacgct gaggcgcgaa agcgtgggga gcaaacagga ttagataccc 660 
tggtagtcca cgctgtaaac gatgagtgct agttgtcggc atgcatgcat gtcggtgacg 720 
cagctaacgc attaagcact ccgcctgggg agtacggtcg caagattaaa actcaaagga 780 
attgacgggg gcccgcacaa gcggtggagc atgtggttta attcgaagca acgcgcagaa 840 
ccttaccacc ttttgacatg ccctgatcgc tggagagatc cagttttccc ttcggggaca 900 
gggacacagg tgctgcatgg ctgtcgtcag ctcgtgtcgt gagatgttgg gttaagtccc 960 
gcaacgagcg caaccctcgc cattagttgc catcattaag ttgggcactc taatgggacc 1020 
gccggtggta agccggagga aggtggggat gacgtcaagt cctcatggcc cttacggggt 1080 
gggctacaca cgtgctacaa tggcgactac agagggttgc aaacctgcga aggggagcta 1140 
atccctaaaa gtcgtctcag ttcggattgc actctgcaac tcgagtgcat gaagtcggaa 1200 
tcgctagtaa tcgcggatca gcatg 1225 



<210> 72 
<211> 1286 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 



<400> 72 

atgattagta gcaatactaa tcgatgacga gcggcggacg ggtgagtaat acgtaggaac 60 
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ctgcccttaa gcgggggata actaagggaa 
agaaaagctg cagcaatgtg gcacttgagg 
aggtaatagc tcaccaaggc gatgatctgt 
gggactgaga cacggcccag actcctacgg 
gggcaaccct gatccagcga tgccgcgtgg 
ttaggtcggg aagaaggtta gtagaggaaa 
agcaccggca aactctgtgc cagcagccgc 
atttactggg cgtaaagggc gcgtaggcgg 
tcaacctggg aagtgcatcg caaactgtct 
tccggtgtag cggtgaaatg cgtagagatc 
ctggcataat actgacgctg aggcgcgaaa 
ggtagtccac gctgtaaact atgagtacta 
agctaacgcg ataagtattc cgcctgggaa 
ttgacggggg cccgcacaag cggtggagca 
cttacctacc cttgacatcc tgagaatctg 
agagacaggt gctgcatggc tgtcgtcagc 
taacgagcgc aacccttgcc cttagttgcc 
ccagtgatga actggaggaa ggcggggacg 
ggccacacac gtgctacaat ggggcgtacg 
tctcataaag cgtctcgtag tccggattgg 
tcgctagtaa tcgcgaatca gcattg 



actttagcta ataccgcata aactcgagag 120 
aggggcctgc gtcagattag ctagttggtg 180 
aactggtctg agaggacgac cagtcacact 240 
gaggcagcag tggggaatat tggacaatgg 300 
gtgaagaagg ccttcgggtt gtaaagccct 360 
tgctattaac ttgacggtac cgacagaata 420 
ggtaatacag agggtgcgag cgttaatcgg 480 
tgagatgtgt gtgatgtgaa agccccaggc 540 
gactggagta tatgagaggg tggcggaatt 600 
ggaaggaacg tcgatggcga aggcagccac 660 
gcgtggggat cgaacaggat tagataccct 720 
gatgttggta ggggaaccta tcggtatcga 780 
gtacggccgc aaggttgaaa ctcaaatgaa 840 
tgtggtttaa ttcgatgcaa cgcgaagaac 900 
gcttagtagc tggagtgccg aaaggagctc 960 
tcgtgttgtg agatgttggg ttaagtcccg 1020 
atcatttagt tggggactct aaggggaccg 1080 
acgtcaagtc atcatggcct ttatgggtag 1140 
gagggtcgca aacccgcgag ggggagctaa 1200 
agtctgcaac tcgactccat gaagttggaa 1260 
1286 



<210> 73 
<211> 1288 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisrae du sol 
<400> 73 

cggggcaacc ctggcggcga gcggcgaacg ' ggtgagtaat gcatcggaac gtgtcctctt 60 
gtgggggata accagtcgaa agactggcta ataccgcatg agatcgaaag atgaaagcag 120 
gggaccgcaa ggccttgcgc gagaggagca gccgatgccg gattagctag ttggtggggt 180 
aaaagcctac caaggcgacg atccgtagct ggtctgagag gacgaccagc cacactggga 240 
ctgagacacg gcccagactc ctacgggagg cagcagtggg gaattttgga cagtgggggc 300 
aaccctgatc cagccatgcc gcgtgtgtga agaaggcctt cgggttgtaa agcactttcg 360 
gacggaacga aatcgcgcga gttaatagtt cgcgtggatg acggtaccgt aagaagaagc 420 
accggctaac tacgtgccag cagccgcggt aatacgtagg gtgcgagcgt taatcggaat 480 
tactgggcgt aaagtgtgcg caggcggctt cgcaagtcga gtgtgaaatc cccgagctta 540 
acttgggaat tgcgctcgaa actacggagc cggagtgtgg cagaggaagg tggaattcca 600 
cgtgtagcgg tgaaatgcgt agagatgtgg aggaacaccg atggcgaagg cggccttctg 660 
ggccaacact gacgctcatg cacgaaagcg tggggagcaa acaggattag ataccctggt 720 
agtccacgcc ctaaacgatg atgactagtt gttggaggag ttaaatcctt tagtaacgca 780 
gctaacgcgt gaagtcatcc gcctggggag tacggtcgca agattaaaac tcaaaggaat 840 
tgacgggggc ccgcacaagc ggtggatgat gtggtttaat tcgatgcaac gcgaaaaacc 900 
ttacctaccc ttgacatgct aggaacgctg cagaaatgta gcggtgcccg aaagggaacc 960 
tagacacagg tgctgcatgg ctgtcgtcag ctcgtgtcgt gagatgttgg gttaagtccc 1020 
gcaacgagcg caacccctgc cattagttgc tacattcagt tgagcactct aatgggactg 1080 
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ccggtgacaa accggaggaa ggtggggatg 
ggctacacac gtcatacaat ggcgcgtaca 
tcccagaaag cgcgtcgtag tccggattgg 
atcgctagta atcgcggatc agcatgtc 



acgtcaagtc ctcatggccc ttatgggtag 1140 
gagggttgcc aacccgcgag ggggagccaa 1200 
agtctgcaac tcgactccca tgaagtcgga 1260 
1288 



<210> 74 
<211> 600 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sSqpience :Orgaiiisme du sol 
<400> 74 

cgtgccagca gccgcggtaa tacgtaggtg gcaagcgttg tccggaatta ttgggcgtaa 60 
agcgcgcgca ggtggtttct taagtctgat gtgaaagccc acggcttaac cgtggagggt 120 
cattggaaac tgggagactt gagtgcagaa gaggaaagtg gaattccaag tgtagcggtg 180 
aaatgcgtag agatttggag gaacaccagt ggcgaaggcg actttctggt ctgcaactga 240 
cgctgaggcg cgaaagcatg gggagcaaac aggattagat accctggtag tccatgccgt 300 
aaacgatgag tgctaagtgt tagggggttt ccgcccctta gtgctgcagc taacgcatta 360 
agcactccgc ctggggagta cgaccgcaag gttgaaactc aaaggaattg acgggggccc 420 
gcacaagcgg tggagcatgt ggtttaattc gaagcaacgc gaagaacctt accaggtctt 480 
gacatcccga tgancgctct agagatagag ttttcccttc ggggacattg gtgacaggtg 540 
gtgcatggtt gtcgtcagct cgtgtcgtga gatgttgggt taagtcccgc aacgagcgca 600 



<210> 75 
<211> 601 
<212> AON 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 75 

cgtgccagca gccgcggtaa tacgtaggtg gcaagcgttg tccggaatta. ttgggcgtaa 60 
agcgcgcgca ggtggtttct taagtctgat gtgaaagccc acggcttaac cgtggagggt 120 
cattggaaac tgggagactt gagtgcagaa gaggaaagtg gaattccaag tgtagcggtg 180 
aaatgcgtag. agatttggag gaacaccagt ggcgaaggcg actttctggt ctgcaactga 240 
cgctgaggcg cgaaagcatg gggagcaaac aggattagat accctggtag tccatgccgt 300 
aaacgatgag tgctaagtgt tagggggttt ccgcccctta gtgctgagct aacgcattaa 360 
gcactccgcc tggggagtac gaccgcaagg ttgaaactca aaggaattga cgggggcccg 420 
cacaagcggt ggagcatgtg gtttaattcg aagcaacgcg aagaacctta ccaggtcttg 480 
acatcccgat gacgctctag agatagagtt ttcccttcgg ggacattggt gacaggtggt 540 
gcatggttgt cgtcagctcg tgtcgtgaga tgttgggtta agtcccgcaa cgagcgcacc 600 
c 601 



<210> 76 
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<211> 1236 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 76 

tgccctgtag acggggataa cttcgggaaa ccggagctaa taccggataa tcctcttccc 60 
cacatgggga agagttgaaa ggcgctttcg cgtcactaca ggatgggccc gcggtgcatt 120 
agctagttgg tagggtaacg gcctaccaag gcgacgatgc atagccgacc tgagagggtg 180 
atcggccaca ttgggactga gacacggccc aaactcctac gggaggcagc agtagggaat 240 
cttccacaat ggacgaaagt ctgatggagc aacgccgcgt gagtgatgaa ggttttcgga 300 
tcgtaaaact ctgttgtaag ggaagaacca gtacgtcagg caatggacgt accttgacgg 360 
taccttatta gaaagccacg gctaactacg tgccagcagc cgcggtaata cgtaggtggc 420 
aagcgttgtc cggaattatt gggcgtaaag cgcgcgcagg tggtttctta agtctgatgt 480 
gaaagcccac ggcttaaccg tggagggtca ttggaaactg ggagacttga gtgcagaaga 540 
ggaaagtgga attccaagtg tagcggcgaa atgcgtagag atttggagga acaccagtgg 600 
cgaaggcgac tttctggtct gcaactgacg ctgaggcgcg aaagcatggg gagcaaacag 660 
gattagatac cctggtagtc catgctgtaa acgatgagtg ctaagtgtta gggggtttcc 720 
gccccttagt gctgcagcta acgcattaag cactccgcct ggggagtacg accgcaaggt 780 
tgaaactcaa aggaattgac gggggcccgc acaagcggtg gagcatgtgg tttaattcga 840 
agcaacgcga agaaccttac caggtcttga catcccgatg atcgctctgg agatagagtt 900 
ttcccttcgg ggacattggt gacaggtggt gcatggttgt cgtcagctcg tgtcgtgaga 960 
tgttgggtta agtcccgcaa cgagcgcaac ccttaatctt agttgccatc atttagttgg 1020 
gcactctaag gtgactgccg gtgataaacc ggaggaaggt ggggatgacg tcaaatcatc 1080 
atgcccctta tgacctgggc tacacacgtg ctacaatgga cggtacaaag agtcgctaac 1140 
tcgcgagagt atgctaatct catagaaccg ttctcagttc ggattgtagg ctgcaactcg 1200 
cctacatgaa gccggaatcg ctagtaatcg cggatc 1236 



<210> 77 
<211> 815 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence rOrganisme du sol 

<400> 77 

caagcgttgt ccggaattat tgggcgtaaa gagctcgtag gcggtttgtc gcgtctgctg 60 
tgaaaactcg aggctcaacc tcgggcttgc agtgggtacg ggcagactag agtgcggtag 120 
gggtgactgg aattcctggt gtagcggtgg aatgcgcaga tatcaggagg aacaccgatg 180 
gcgaaggcag gtcactgggc cgcaactgac gctgaggagc gaaagcatgg ggagcgaaca 240 
ggattagata ccctggtagt ccatgccgta aacgttgggc actaggtgtg gggctcattc 300 
cacgagttcc gtgccgcagc aaacgcatta agtgccccgc ctggggagta cggccgcaag 360 
gcttaaaact caaagaaatt gacgggggcc cgcacaagcg gcggagcatg cggattaatt 420 
cgatgcaacg cgaagaacct taccaaggct tgacatacac cggaaacttc cagagatggt 480 
tgccccgcaa ggtcggtgta caggtggtgc atggttgtcg tcagctcgtg tcgtgaagat 540 
gttgggttaa gtcccgcaac gagcgcaacc ctcgtcctat gttgccagca cgtgatggtg 600 



wo 01/40497 



PCT/FROO/03311 



gggactcata ggagactgcc ggggtcaact 
catgcccctt atgtcttggg cttcacgcat 
accgcaaggt ggagcgaatc ccaaaaagcc 
gaccccatga agtcggagtc gctagtaatc 



cggaggaagg tggggatgac gtcaaatcat 660 
gctacaatgg ccggtacaaa gggctgcgat 720 
ggtctcagtt cggattgggg tctgcaactc 780 
gcaga 815 



<210> 78 
<211> 826 
<212> ADN 

<213> Organime Inconnu 



<220> 

<223> Origine de la sequence : Organ! sme du sol 



<400> 78 

tcgtaggtgg cttgtcacgt cgggtgtgaa 
gatacgggct ggctagaggt aggtagggga 
cgcagatatc aggaggaaca ccggtggcga 
aggagcgaaa gcgtggggag cgaacaggat 
ttgggcgcta ggtgtgggga ccttccacgg 
cccgcctggg gagtacggcc gcaaggctaa 
agcggcggag catgttgctt aattcgacgc 
cgcccggaaa gcttcagaga tggagccctc 
gtcgtcagct cgtgtcgtga gatgttgggt 
aatgttgcca gcaacatcct tcggggtggt 
ctcggaggaa ggtggggacg acgtcaagtc 
atgctacaat ggccggtaca gagggttgcg 
ccggtctcag ttcggattgg ggtctgcaac 
tcgcagatca gcaacgctgc ggtgaatacg 



agcttggggc ttaactccag gtctgcattc 60 
gaacggaatt cctggtgtag cggtgaaatg 120 
aggcggttct ctgggcctta cctgacgctg 180 
tagataccct ggtagtccac gctgtaaacg 240 
tttccgcgcc gtagctaacg cattaagcgc 300 
aactcaaagg aattgacggg ggcccgcaca 360 
aacgcgaaga accttaccaa ggcttgacat 420 
ttcggactgg gtgacaggtg gtgcatggct 480 
taagtcccgc aacgagcgca acccttgttc 540 
tggggactca ttggagactg ccggggtcaa 600 
atcatgcccc ttatgtcttg ggctgcaaac 660 
ataccgcaag gtggagcgaa tccctaaaag 720 
tcgaccccat gaagtcggag tcgctagtaa 780 
ttcccgggcc ttgtac 826 



<210> 79 
<211> 799 
<212> AON 

<213> Organime Inconnu 



<220> 

<223> Origine de la sequence :Organisme du sol 



<400> 79 

cgtaggcggt ttgtcgcgtc tgccgtgaaa 
gtacgggcag actagagtga tgtaggggag 
gcagatatca ggaggaacac cgatggcgaa 
ggagcgaaag catggggagc gaacaggatt 
tgggcactag gtgtggggga cattccacgt 
cccgcctggg gagtacggcc gcaaggctaa 
agcggcggag catgcggatt aattcgatgc 
gaaccggaaa cacctggaaa caggtgcccc 
ttgtcgtcag ctcgtgtcgt gagatgttgg 
tctatgttgc cagcgcgtta tggcggggac 



gtccggggct caactccgga tctgcggtgg 60 
actggaattc ctggtgtagc ggtgaaatgc 120 
ggcaggtctc tgggcattaa ctgacgctga 180 
agataccctg gtagtccatg ccgtaaacgt 240 
tttccgcgcc gtagctaacg cattaagtgc 300 
aactcaaagg aattgacggg ggcccgcaca 360 
aacgcgaaga accttaccaa ggcttgacat 420 
gcttgcggtc ggtttacagg tggtgcatgg 480 
gttaagtccc gcaacgagcg caaccctcgt 540 
tcataggaga ctgccggggt caactcggag 600 



wo 01/40497 
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PCT/FROO/03311 



gaaggtgggg acgacgtcaa atcatcatgc 

aatggccggt acaaagggtt gcgatactgt 

cagttcggat tggggtctgc aactcgaccc 

tcagcaacgc tgcggtgaa 



cccttatgtc ttgggcttca cgcatgctac 660 
gaggtggagc taatcccaaa aagccggtct 720 
catgaagtcg gagtcgctag taatcgcaga 780 
799 



<210> 80 
<211> 1250 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisnie du sol 
<400> 80 

tgccagcttg ctggtggatt agtggcgaac gggtgagtaa cacgtgagta acctgccctt 60 
aactctggga taagcctggg aaactgggtc taatgccgga tatgactcct catcgcatgg 120 
tggggggtgg aaagcttttt gtggttttgg atggactcgc ggcctatcag cttgttggtg 180 
aggtaatggc tcaccaaggc gacgacgggt agccggcctg agagggtgac cggccacact 240 
gggactgaga cacggcccag acttctacgg gaggcagcag tggggaatat tgcacaatgg 300 
gcgaaagcct gatgcagcga cgccgcgtga gggatgacgg ccttcgggtt gtaaacctct 360 
ttcagtaggg aagaagcgaa agtgacggta cctgcagaag aagcgccggc taactacgtg 420 
ccagcagccg cggtaatacg tagggcgcaa gcgttatccg gaattattgg gcgtaaagag 480 
ctcgtaggcg gtttgtcgcg tctgccgtga aagtccgggg ctcaactccg gatctgcggt 540 
gggtacgggc agactagagt gatgtagggg agactggaat tcctggtgta gcggtgaaat 600 
gcgcagatat caggaggaac accgatggcg aaggcaggtc tctgggcatt aactgacgct 660 
gaggagcgaa agcatgggga gcgaacagga ttagataccc tggtagtcca tgccgtaaac 720 
gttgggcact aggtgtgggg gacattccac gttttccgcg ccgtagctaa cgcattaagt 780 
gccccgcctg gggagtacgg ccgcaaggct aaaactcaaa ggaattgacg ggggcccgca 840 
caagcggcgg agcatgcgga ttaattcgat gcaacgcgag gaaccttacc aaggcttgac 900 
atgaaccgga aatacctgga aacaggtgcc ccgcttgcgg tcggtttaca ggtggtgcat 960 
ggttgccgtc agctcgtgtc gtgagatgtt gggttaagtc ccgcaacgag cgcaaccctc 1020 
gttctatgtt gccagcgcgt tatggcgggg actcatagga gactgccggg gtcaactcgg 1080 
aggaaggtgg ggacgacgtc aaatcatcat gccccttatg tcttgggctt cacgcatgct 1140 
acaatggccg gtacaaaggg ttgcgatact gtgaggtgga gctaatccca aaaagccggt 1200 
ctcagttcgg attggggtct gcaactcgac cccatgaagt cggagtcgct 1250 



<210> 81 
<211> 1210 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 81 

cgctaatacc ggatacggcg cgagagtctt cggactttcg cgagaaagat tcgcaaggat 60 
cactgaggga cgagcctgcg gcccatcagc tagttggtga ggtaagagct caccaaggct 120 
aagacgggta gctggtctga gaggatgatc agccacactg gaactgagac acggtccaga 180 
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ctcctacggg aggcagcagt ggggaatatt 
gccgcgtgag cgatgagggc cttcgggtcg 
cggtgaagag tcggccttga cggtatctcc 
agccgcggta atacggaggg tgcaaacgtt 
aggcggcgtg ataagttggg tgtgaaagcc 
ctgtcacgct tgaatctcgg agggggtcag 
gatatcggga ggaataccag tggcgaaggc 
gcgaaagcgc ggggagcaaa caggattaga 
gtgctagacg ggggaggtat tgaccccttc 
cctggggagt acggtcgcaa gactaaaact 
gtggagcatg tggtttaatt cgacgcaacg 
gaacctggct gaaaggctgg ggtgccctcc 
gtcgtcagct cgtgtcgtga gatgttgggt 
tcagttgcca acattaaggt gggaactctg 
tggggacgac gtcaagtcct catggccctt 
ctggtacaat gagccgcaaa accgcgaggt 
cggatcggag tctgcaactc gactccgtga 
acgctttcgg 



gcgcaatggg cgaaagcctg acgcagccac 240 
taaagctctg tggggagaga cgaataaggc 300 
ttagcaagca ccggctaact ccgtgccagc 360 
gctcggaatc attgggcgta aagcgcacgt 420 
ctgggctcaa cccaggaagt gcattcaaaa 480 
agaattcccg gtgtagaggt gaaattcgta 540 
gctggcctgg acgaagattg acgctgaggt 600 
taccctggta gtccgcgctg taaacgatga 660 
gctgccgaag ctaacgcgtt aagcactccg 720 
caaaggaatt gacgggggcc cgcacaagcg 780 
cgcaaaacct tacctgggtt aaatccgccg 840 
ggggaatcgg tgagaaggtg ctgcatggct 900 
taagtcccgc aacgagcgca acccctatcg 960 
gcgagactgc cggtctaaac cggaggaagg 1020 
atgcccaggg ctacacacgt gctacaatgg 10.80 
caagctaatc tcaaaaaacc agtctcagtt 1140 
agctggaatc gctagtaatc gaagatcagc 1200 
1210 



<210> 82 
<211> 1272 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisnie du sol 
<400> 82 

gatgccagct tgctggtgga ttagtggcga acgggtgagt aacacgtgag taacctgccc 60 
ttaactctgg gataagcctg ggaaactggg tctaataccg gatatgactc ctcatcgcat 120 
ggtggggggt ggaaagcttt ttgtggtttt ggatggactc gcggcctatc agcttgttgg 180 
tgaggtaatg gctcaccaag gcgacgacgg gtagccggcc tgagagggtg accggccaca 240 
ctgggactga gacacggccc agactcctac gggaggcagc agtggggaat attgcacaat 300 
gggcgaaagc ctgatgcagc gacgccgcgt gagggatgac ggccttcggg ttgtaaacct 360 
ctttcagtag ggaagaagcg aaagtgacgg tacctgcaga agaagcgccg gctaactacg 420 
tgccagcagc cgcggtaata cgtagggcgc aagcgttatc cggaattatt gggcgtaaag 480 
agctcgtagg cggtttgtcg cgtctgccgt gaaagtccgg ggctcaactc cggatctgcg 540 
gtgggtacgg gcagactaga gtgatgtagg ggagactgga attcctggtg tagcggtgaa 600 
atgcgcagat atcaggagga acaccgatgg cgaaggcagg tctctgggca ttaactgacg 660 
ctgaggaacg aaagcatggg gagcgaacag gattagatac cctggtagtc catgccgtaa 720 
acgttgggca ctaggtgtgg gggacattcc acgttttccg cgccgtagct aacgcattaa 780 
gtgccccgcc tggggagtac ggccgcaagg ctaaaactca aaggaattga cgggggcccg 840 
cacaagcggc ggagcatgcg gattaattcg atgcaacgcg aagaacctta ccaaggcttg 900 
acatgaaccg gaaatacctg gaaacaggtg ccccgcttgc ggtcggttta caggtggtgc 960 
atggttgtcg tcagctcgtg tcgtgagatg ttgggttaag tcccgcaacg agcgcaaccc 1020 
tcgttctatg ttgccagcgc gttatggcgg ggactcatag gagactgccg gggtcaactc 1080 
ggaggaaggt ggggacgacg tcaaatcatc atgcccctta tgtcttgggc ttcacgcatg 1140 
ctacaatggc cggtacaaag ggttgcgata ctgtgaggtg gagctgatcc caaaaagccg 1200 
gtcccagttc ggattggggt ctgcaactcg accccatgaa gtcggagtcg ctagtaatcg 1260 
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cagatcagca ac 1272 



<210> 83 
<211> 1247 
<212> ADN 

<213> Organime Incoimu 
<220> 

<223> Origine de la sequence :Organisrae du sol 
<400> 83 

tgtttagtag caatactaaa tgatgacgag cggcggacgg gtgaggaaca cgtaggaacc 60 
tgcccaagag agggggacaa ccaagggaaa ctttggctaa taccgcataa tctctacgga 120 
gaaaagttgc ccgtaagggt ggcgcttttg gaggggcctg cgtccgatta gttagttggt 180 
gaggtaatag ctcaccaaga ctgtgatcgg taactggtct gagaggacga ccagtcacac 240 
tgggactgag acacggccca gactcctacg ggaggcagca gtggggaatc ttggacaatg 300 
ggggcaaccc tgatccagcg atgccgcgtg ggtgaagaag gccttcgggt tgtaaagccc 360 
tttaggcggg gaagaaggat atgggatgaa taagcctgta ttttgacggt acccgcagaa 420 
taagcaccgg caaactctgt gccagcagcc gcggtaatac agagggtgcg agcgttaatc 480 • 
ggatttactg ggcgtaaagg gcgcgtaggc ggttgtgtga gtgtgatgtg aaagccccgg 540 
gctcaacctg ggaagtgcat cgcaaacgac acaactggag tatatgagag ggtggcggaa 600 
tttccggtgt agcggtgaaa tgcgtagaga tcggaaggaa cgtcgatggc gaaggcagcc 660 
acctggcata atactggcgc tgaggcgcga aagcgtgggg agcgaacagg attagatacc 720 
ctggtagtca cgcccgtaaa cgatgagaac tagatgttgg agggggaacc cttcagtatc 780 
gaagctaacg cgataagttc tccgcctggg aagtacagtc gcaagactga aactcaaaag 840 
aattgacggg ggcccgcaca agcggtggag catgtggttt aattcgatgc aacgcgaaga 900 
accttacctg cccttgacat cctgcgaatc ttgccgagag gtgagagtgc cgcagggagc 960 
gcagagacag gtgctgcatg gctgtcgtca gctcgtgttg tgagatgttg ggttaagtcc 1020 
cgtaacgagc gcaacccttg tccttagttg ccatcattta gttggggact ctaaggagac 1080 
cgccggtgat gaaccggagg aaggcgggga cgacgtcaag tcatcatggc ctttatgggt 1140 
agggctacac acgtgctaca atggggcgta cagagggtcg ccaacccgcg agggggagcc 1200 
aatctcttaa agcgtctcgt agtccggatt ggagtctgca actcgac 1247 



<210> 84 
<211> 1292 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la s6querice rOrganisrae du sol 
<400> 84 

ggctcgcaag agcaaccggc gaacgggtgc gtaacacgtg aacaacctgc cctcgtgtgg 60 
gggatagccg ggctaacgcc cgggtaatac cgcatacgtt ctctctgggg agtcctgggg 120 
agaggaaagc tccggcgcac ggggaggggt tcgcggccta tcagctagtt ggcggggtaa 180 
tggcccacca aggcgacgac gggtagctgg tctgagagga tggccagcca cattgggact 240 
gagagacggc ccagactcct acgggaggca gcagtgggga atcttgcgca atggccgaaa 300 
ggctgacgca gcgacgccgc gtgtgggagg acgcctttcg gggtgtaaac cactgttgcc 360 
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cgggacgaac agcctctttc gagaggtctg 
tccgtgccag cagccgcggt aatacggagg 
aaagggcgcg taggtggccc ggtcagttcg 
ggccatgaat actgccgcgg ctggagcact 
gtggaatgcg tagagatccg gaagaacacc 
tgacactgag gcgcgacagc gtggggagca 
cgtaaacgat gggcactagg cgcttggggg 
ttaagtgccc cgcctgggga gtacggccgc 
cccgcacaag cggtggagca tgtggtttaa 
cttgacatac acgggaaacc ggtcagaaac 
tgctgcatgg ctgtcgtcag ctcgtgtcgt 
caacccctgt ctctagttgc cagcgcgtca 
caaaccggag gaaggtgggg atgacgtcaa 
cacgtgctac aatggcgggg acagagggtc 
aaccccgcct cagttcggat tgtcgtctgc 
taatcgtgga tcagctacgc cacggtgaat 



acggtaccgg gtgaggaagc accggctaac 420 
gtgcgagcgt tgtccggaat cattgggcgt 480 
tggtgaaagc gcggggctca accctgcgtc 540 
gtagaggcag gcggaattcc gggtgtagcg 600 
ggtggcgaag gcggcctgct gggcagtagc 660 
aacaggatta gataccctgg tagtccacgc 720 
agcgaccccc cgagggccgg cgctaacgca 780 
aaggcCgaaa ctcaaaggaa ttgacggggg 840 
ttcgacgcaa cgcgaagaac cttacctagg 900 
ggccggccct cttcggagcc cgtgcacagg 960 
gagatgttgg gttaagtccc gcaacgagcg 1020 
tggcggggac tctagagaga ctgccggtgc 1080 
gtcatcatgg tccttacgtc tagggctaca 1140 
gcgagccggc aacggcaagc caatcccgta 1200 
aactcgacgg catgaagctg gaatcgctag 1260 
ac 1292 



<2iO> 85 
<211> 1300 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 85 

tcccttcggg agcaagtaca gcggcgaacg ggtgagtaac acgtaggtaa cctaccctgg 60 
agactgggat aacctgccga aaggcgggct aataccagat aagaccacga gggctgcggc 120 
ccttggggca aaaggtggcc tctacttgta agctaccact ccgggatggg cctgcgcgcc 180 
attagctagt tggcggggta acggcccacc aaggcagaga tggctagctg gtctgagagg 240 
atggccagcc acacagggac tgagacacgg cccagactcc tacgggaggc agcagtgggg 300 
aatattgcgc aatgggcgaa agcctgacgc agcgacgccg cgtgggtgat gaaggccttc 360 
gggtcgtaaa gccctgtcaa gagggacgaa accttgtcga cctaacacgt cggcaacctg 420 
acggtacctc tgaaggaagc accggctaac tccgtgccag cagccgcggt aatacggagg 480 
gtgcgagcgt tgttcggaat tactgggcgt aaagcgcgtg taggcggcct cttcagtctg 540 
gtgtgaaagc ccggggctca accccggaag tgcattggat actgggaggc tggagtaccg 600 
gagaggaggg tggaattcct ggtgtagcgg tgaaatgcgt agatatcagg aggaacacct 660 
gtggcgaagg cggccctctg gacggatact gacgctgaga cgcgaaagcg tggggagcaa 720 
acaggattag ataccctggt agtccacgct gtaaacgatg ggcactaggt gttcggggta 780 
ttgaccccct gagtgccgca gctaacgcat taagtgcccc gcctggggaa tacggccgca 840 
aggttaaaac tcaaaggaat tgacgggggc ccgcacaagc ggtggagcat gtggtttaat 900 
tcgacgcaac gcgaagaacc ttacctgggc tagacaacat cggacagcct cagaaatgag 960 
gtctccccgc aaggggccgg tggttcaggt gctgcatggc tgtcgtcagc tcgtgtcgtg 1020 
agatgttggg ttaagtcccg caacgagcgc aacccctgtc tctagttgct accattcagt 1080 
tgagcactct agagagactg cccngtgtta aacgggagga aggtggggac gacgtcaagt 1140 
cctcatggcc cttatgtcca gggctacaca cgtgctacaa tgggcgatac aaagggctgc 1200 
gaacccgcga ggggaagcca atcccaaaaa gtcgctctca gttcggattg gagtctgcaa 1260 
ctcgactcca tgaaggcgga atcgctagta atcgcggatc 1300 
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<210> 86 
<211> 1186 
<212> ADN 

<213> Organime Incoimu 
<220> 

<:223> Origlne de la sgc[uence .-Organisme du sol 
<400> 86 

caatgggcag cggcggacgg gtgagtaaca cgtgggaatg tacctttcgg tgcggaacaa 60 
ctcagggaaa cttgagctaa tgccgcatac gcccttacgg ggaaagattt atcgccgaaa 120 
gatcagcccg cgttggatta gctagttggt gaggtaatgg cccaccaagg cgacgatcca 180 
tagctggttt gagagaacga ccagcctcac tgggactgag acacggccca gactcctacg 240 
ggaggcagca gttgggaatc ttggacaatg ggggaaaccc tgatccagcc atgccgcgtg 300 
agtgatgaag gccttcgggt tgtaaaactc tttcgacggg gacgataatg acggtacccg 360 
tagaagaagc tccggctaac ttcgtgccag cagccgcggt aatacgaagg gggctagcgt 420 
tgttcggaat tactgggcgt aaagcgtgcg caggcggcta tccaagtcag tggtgaaagc 480 
ccggagctca actccggaat tgccattgaa actgtttagc ttgagtacga gagaggtgag 540 
tggaataccc agtgtagagg tgaaattcgt agatattggg tagaacaccg gtggcgaagg 600 
cggctcactg gctcgtaact gacgctcagg cacgacagcg tggggatcaa acaggattag 660 
ataccctggt agtccacgcc gtaaacgatg aacgctagcc gttggatagc ttgctattca 720 
gtggcgcagc taacgcatta agcgttccgc ctggggagta cggccgcaag gttgagactc 780 
agaggaattg acgggggccc gcacaagcgg tggagcatgt ggtttaattc gacgcaacgc 840 
gcagaacctt accagggttt gacatcctgt gctcgccggt gaaagccggt tttcccgcaa 900 
gggacgcaga gacaggtgct gcatggctgt cgtcagctcg tgtcgtgaga tgttgggtta 960 
agtcccgcaa cgagcgcaac cctcgccttt agttgccatc attcagttgg gcactctaga 1020 
gggaccgccg gcgacaagcc ggaggaaggt ggggatgacg tcaagtcccc atggccctta 1080 
caccctgggc tacacacgtg ctacaatggc ggtgacagtg ggcacgagct cgcgagagtc 1140 
agctaatccc aaaaaaccgt cccagttcag attgcactct gcaact 1186 



<210> 87 
<211> 1454 
<212> ADN 

<213> Organime Znconnu 
<220> 

<223> Origine de la sec[uence : Organisme du sol 
<400> 87 

cgacggccag tgaattgtaa tacgactcac tatagggcga attgggccct ctagatgcat 60 
gctcgagcgg ccgccagtgt gatggatatc tgcagaattc gcccttcagg cctaacacat 120 
gcaagtcgag cgagaaaggg cgcttcggcg cctgagtaca gcggcgcacg ggtgcgtaac 180 
acgtgggcaa tctgtccttg agatggggat aacccagcga aagttgggct aataccgaat 240 
aagactacag gaggcaactc ccgtggttaa agggtgctct ctgcggggag catgcgcttg 300 
aggaggagcc cgcggcctat cagctagttg gtagggtcac ggcctaccaa ggcgaagacg 360 
ggtagctggt ctgagaggat gaccagccac acggggactg agacacggcc ccgactccta 420 
cgggaggcag cagtggggaa tattgggcaa tgggggaaac cctgacccag cgacgccgcg 480 
tgggtgatga aggccttcgg gtcgtaaagc cctgtcgggc ggaacgaagg ttctcacggc 540 
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aaatagccgt gagaggtgac ggtaccgccg 
gccgcggtaa gacggagggt gcaagcgttg 
ggcggtctcg caagtctggc gtgaaagccc 
tgcgaggctg gagtgccgga ggggagagtg 
agatcgggag gaataccggt ggcgaaagcg 
cgaaagcgtg gggagcaaac aggattagat 
cactaggtgt cgggggtatc cactccctcg 
ctgggaagta cggtcgcaag attaaaactc 
tggagcatgt ggttcaattc gatgcaacgc 
gaatctctgg gaaaccagag agtgcccgca 
gtcgtcagct cgtgccgtga ggtgttgggt 
ttagttgccc ccgggtcaag ccgtggcact 
aaggtgggga cgacgtcaag tcatcatggc 
atggctggga canagcgtgg ccaacgcgcg 
agttcggatc ggagtctgca actcgactcc 
cagcatgccg cggt 



aaggaagcac cggccaactc cgtgccagca 600 
ctcggaatca ctgggcgtaa agggtgcgta 660 
aaggctcagc cttggaagtg cgctcgaaao 720 
gaattcccgg tgtagcggtg aaatgcgtag 780 
actctctgga cggcaactga cgctgaggca 840 
accctggtag tccacgccgt aaacgatgga 900 
gtgccgccgc taacgcagta agtgtcccgc 960 
aaaggaattg acgggggccc gcacaagcgg 1020 
gaagaacctt acctgggttt gacatctggc 1080 
ggggagcgcc aagacaggtg ctgcatggct 1140 
taagtcccgc aacgagcgca acccttaccc 1200 
ccaagggaac tgcccgtgtt aagcgggagg 1260 
ctttatatcc agggctacac acgtgctaca 1320 
agcgggagct aatcgcaaaa ccccagcctc 1380 
gtgaagctgg aatcgctagt aatcgcggat 1440 
1454 



<210> 88 
<211> 1307 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la siquence lOrganisme du sol 
<400> 88 

cccttcgggg agcgagtaca gcggcgaacg ggtgagtaac acgtaggtaa cctaccctgg 60 
tgactgggat aacttgccga aaggcgggct aataccagat aagaccacga gggctgcggc 120 
ctttggggta aaagatggcc tctgcttgca tgctatcacg ccgggatggg cctgcgcgcc 180 
attagctagt tggtgaggta acggctcacc aaggcagaga tggctagctg gtctgagagg 240 
atggccagcc acactgggac tgagacacgg cccagactcc tacgggaggc agcagtgggg 300 
aatattgcgc aatgggcgaa agcctgacgc agcgacgccg cgtgggtgat gaaggccttc 360 
gggtcgtaaa gccctgtcaa gagggacgaa acctcgccga cccaatacgt cggcgacctg 420 
acggtacctc tgaaggaagc accggctaac tccgtgccag cagccgcggt aatacggagg 480 
gtgcaagcgt tgttcggaat cactgggcgt aaagcgcgtg taggcggcct tcttagtctg 540 
gtgtgaaagc ccggggctca accccggaag agcattggat actggaaggc tggagtaccg 600 
gagaggaggg tggaattcct ggtgtagcgg tgaaatgcgt agatatcagg aggaacaccg 660 
gtggcgaagg cggccctctg gacggatact gacgctgaga cgcgacagcg tggggagcaa 720 
acaggattag ataccctggt agtccacgcc gtaaacgatg ggtactaggt gttcggggta 780 
ttgaccccct gagtgccgca gctaacgcat taagtacccc gcctggggac tacggccgca 840 
aggctaaaac tcaaaggaat tgacgggggc ccgcacaagc ggtggagcat gtggtttaat 900 
tcgacgcaac gcgaagaacc ttacctgggc tagacaacac tggacagccc cagaaatggg 960 
gtcttcccgc aagggactgg tggttcaggt gctgcatggc tgtcgtcagc tcgtgtcgtg 1020 
agatgttggg ttaagtcccg caacgagcgc aacccctgtc tctagttgct accattaagt 1080 
tgagcactct agagagactg cccgtgttaa acgggaggaa ggtggggacg acgtcaagtc 1140 
ctcatggccc ttatgtccag ggctacacac gtgctacaat ggacagtaca aagggctgcg 1200 
aacccgtgag ggggagccaa tcccaaaaag ctgttctcag ttcggattgg agtctgcaac 1260 
tcgactccat gaaggcggaa tcgctagtaa tcgcggatca gcatgcc 1307 
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<210> 89 
<211> 1305 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Orlgine de la sequence :Organisme du sol 
<400> 89 

gggagcaatc cccaagtaga gcggcgaacg ggtgagtaac gcgtgggtaa tctgcctccg 60 
agtggggaac aacatcggga aactggtgct aataccgcat aacatcgttg ggtcttcgga 120 
tctgacgatc aaagccgggg accgcaaggc ctggcgcttg gagaggagcc cgcgtccgat 180 
tagctagttg gtggggtaat ggcccaccaa ggcttcgatc ggtagccggc ctgagagggc 240 
ggacggccac actgggactg agacacggcc cagactccta cgggaggcag cagtggggaa 300 
tttttcgcaa tgggcgaaag cctgacgaag caacgccgcg tggaggatga gggccttcgg 360 
gtcgtaaact cctgtcgacc gggacgaaag taggatggcc taatacgccg atctattgac 420 
tgtaccggtg gaggaagcca cggctaactc tgtgccagca gccgcggtaa tacagaggtg 480 
gcaagcgttg ttcggaatta ctgggcgtaa agggcgcgta ggcggcttgg tcagtcccgt 540 
gtgaaatccc tcggctcaac tgaggaactg cacgggaaac tgcctggctt gagttcggga 600 
gagggaagtg gaattccggg tgtagcggtg aaatgcgtag atatccggag gaacaccggt 660 
ggcgaaggcg gcttcctgga ccgacactga cgctgaggcg cgaaagctag gggagcaaac 720 
gggattagat accccggtag tcctagctgt aaacgatgag tgctgggtgt agggggtatc 780 
aaccccccct gtgccgaagc taacgcatta agcactccgc ctggggagta cggtcgcaag 840 
gctgaaactc aaaggaattg acgggggccc gcacaagcgg tggagcatgt ggttcaattc 900 
gacgcaacgc gaagaacctt accggggttt gaactgtacg ggacagctct agagatagag 960 
tcttccttcg ggacccgtac agaggtgctg catggctgtc gtcagctcgt gtcgtgagat 1020 
gttgggttaa gtcccgcaac gagcgcaacc cttgcctcct gttgccatca ggtaaagctg 1080 
ggcactctgg agagactgcc ggtgataaac cggaggaagg tggggatgac gtcaagtcct 1140 
catggccttt atgccccggg ctacacacgt gctacaatgg ccggtacaaa gggtcgcaaa 1200 
accgcgaggt ggagctaatc ccaaaaagcc ggtcccagtt cggattgcag tctgcaactc 1260 
gactgcatga agttggaatc gctagtaatc gcggatcagc atgcc 1305 



<210> 90 
<211> 1299 
<212> ADN 

<213> Orgeuiime Inconnu 
<220> 

<223> Origine de la sequence :Organiarae du sol 
<400> 90 

gggctttcgg gtcctgagta aagtggcgaa cgggtgagta acgcgtaggt aacctgacct 60 
cgagtgtgga ataacctggc gaaagccggg ctaataccgc atgacgtctt cgggtcttcg 120 
gacttgagga ccaaaggtgg cgagctttga gcgctgtcgc tcgagaaggg gcctgcgtcc 180 
cattagctag ttggtggggt gatggcctac caaggcgacg atgggtagcc gggctgagag 240 
gctgtccggc cacactggaa ccgagacacg gtccagactc ctacgggagg cagcagtggg 300 
gaatcttgcg caatggggga aaccctgacg caacgacgcc gcgtgggcga tgaaggcctt 360 
cgggtcgtaa agccctgtcg agcgggacga accgtgcgag ctctaacata gctcgtgcct 420 



wo 01/40497 



52 



PCT/FROO/03311 



gacggtaccg ctagaggaag ccccggctaa 
ggggctagcg ttattcggaa ttattgggcg 
catgtgaaag ccctcggctc aaccggggaa 
ggagaggtga gtggaattcc cagtgtagcg 
agtggcgaag gcggctcact ggaccggtac 
aacgggatta gataccccgg tagtcctggc 
atcgacccct gccgtgctga agctaacgca 
aaggctgaaa ctcaaaggaa ttgacggggg 
ttcgacgcaa cgcgaagaac cttacctggg 
gggtcttcct tcgggaeacc tgtagaggtg 
gatgttgggt taagtcccgc aacgagcgca 
cgggaactct agggggaccg ccggtgataa 
ctcatggcct ttatgtccag ggctacacac 
aaggcgcgag ccggagccaa tcccaaaaag 
ctcgactgca tgaaggtgga atcgctagta 



ctccgtgcca gcagccgcgg taatacggag 480 
taaagggcgt gtaggcggct ctgtgtgtcc 540 
ctgcatggga aactgcggag cttgagtccg 600 
gtgaaatgcg tagatattgg gaggaacacc 660 
tgacgctgag acgcgaaagc caggggagca 720 
tgtaaacgat gagcacttgg tgtggcgggt 780 
ttaagtgctc cgcctgggga gtacggccgc 840 
cccgcacaag cggtggagca tgtggttcaa 900 
tttgaactgc aggtgacagc ccctgaaagg 960 
ccgcatggct gtcgtcagct cgtgtcgtga 1020 
acccctactc ctagttgcca gcggctcggc 1080 
accggaggaa ggtggggatg acgtcaagtc 1140 
gtgctacaac ggacggtaca aagggctgcg 1200 
ccgttctcca gtgcggattg cagtctgcaa 1260 
atcgcggat 1299 



<210> 91 
<211> 1296 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 91 

atgtctggta gcaataccag atgatggcaa gtggcggacg ggtgagtaat acgtagggat 60 
ctgcccagaa gagggggaca acccggggaa actcgggcta ataccgcata ctattctgag 120 
gaagaaagct tggcgcaagc caggcgcttt tggaggaacc tacgtccgat tagctagttg 180 
gtgaggtaaa ggctcaccaa ggcagagatc ggtagctggt ctgagaggat gaccagccac 240 
actgggactg agacacggcc cagactccta cgggaggcag cagtggggaa tattggacaa 300 
tgggggcaac cctgatccag cgatgccgcg tgtgtgaaga aggccttcgg gttgtaaagc 360 
actttagttg gggaagaagt aatgtttttt aatagagagc attgttgacg gtacccaaag 420 
aataagcacc ggctaactct gtgccagcag ccgcggtaat acagagggtg caagcgttaa 480 
tcggagttac tgggcgtaaa gggcgcgtag gcggtgttgc aagtgagatg tgaaatccct 540 
gggcttaacc taggaaccgc attttagact gcaatgctag agtacagtag agggtagtgg 600 
aatttccggt gtagcggtga aatgcgtaga gatcggaagg aacaccagtg gcgaaggcga 660 
ctacctggac tgacactgac gctgaggcgc gagagcgtgg ggagcaaaca ggattagata 720 
ccctggtagt ccacgctgta aacgatgaga actagatgtt ggtgcgcgcg agcgcacaag 780 
tatcgaagct aacgcgataa gttctccgcc tggggagtac ggccgcaagg ttaaaactca 840 
aaggaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg atgcaacgcg 900 
aggaacctta cctacccttg acatccacag aatttgatag agatatcgaa gtgccgaaag 960 
gaactgtgag acaggtgctg catggctgtc gtcagctcgt gttgtgagat gttgggttaa 1020 
gtcccgtaac gagcgcaacc cttatcctta gttgccaaca cgtaatggtg gggactctaa 1080 
ggagactgcc ggtgaagaac cggaggaagg tggggacgac gtcaagtcat catggccttt 1140 
atgggtaggg ctacacacgt gctacaatgg ggcgtacaga gggttgccaa cctgcgaagg 1200 
ggagccaatc ccggaaagcg cctcgtagtc cagattgaag tctgcaactc gacttcatga 1260 
agtcggaatc gctagtaatc gcgaatcaga acgtcc 1296 
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<210> 92 
<211> 1250 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 

<400> 92 

gtctggtagc aataccagat gatggcaagt ggcggacggg tgagtaatac gtagggatct 60 
gcccagaaga gggggacaac ccggggaaac tcgggctaat accgcatact attctgagga 120 
aaaaagcttg gcgcaagcca ggcgcttttg gaggaaccta cgtccgatta gctagttggt 180 
gaggtaaagg ctcaccaagg cagagatcgg tagctggtct gagaggatga ccagccacac 240 
tgggactgag acacggccca gactcctacg ggaggcagca gtggggaata ttggacaatg 300 
ggggcaaccc tgatccagcg atgccgcgtg tgtgaagaag gccttcgggt tgtaaagcac 360 
tttagttggg gaagaagtaa tgttttttaa tagagagcat tgttgacggt acccaaagaa 420 
taagcaccgg ctaactctgt gccagcagcc gcggtaatac agagggtgca agcgttaatc 480 
ggagttactg ggcgtaaagg gcgcgtaggc ggtgttgcaa gtgagatgtg aaatccctgg 540 
gcttaaccta ggaaccgcat tttagactgc aatgctagag tacagtagag ggtagtggaa 600 
tttccggtgt agcggtgaaa tgcgtagaga tcggaaggaa caccagtggc gaaggcgact 660 
acctggactg acactgacgc tgaggcgcga gagcgtgggg agcaaacagg attagatacc 720 
ctggtagtcc acgctgtaaa cgatgagaac tagatgttgg tgcgcgcgag cgcacaagta 780 
tcgaagctaa cgcgataagt tctccgcctg gggagtacgg ccgcaaggtt aaaactcaaa 840 
ggaattgacg ggggcccgca caagcggtgg agcatgtggt ttaattcgat gcaacgcgaa 900 
gaaccttacc tacccttgac atccacagaa tttgatagag atatcgaagt gccgaaagga 960 
actgtgagac aggtgctgca tggctgtcgt cagctcgtgt tgtgagatgt tgggttaagt 1020 
cccgtaacgg gcgcaaccct tatccttagt tgccaacacg taatggtggg gactctaagg 1080 
agactgccgg tgaagaaccg gaggaaggtg gggacgacgt caagtcatca tggcctttat 1140 
gggtagggct acacacgtgc tacaatgggg cgtacagagg gttgccaacc tgcgaagggg 1200 
agccaatccc ggaaagcgcc tcgtagtcca gattgaagtc tgcaactcga 1250 



<210> 93 
<211> 1545 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisrae du sol 
<400> 93 

ccaggaaaca gctatgacca tgattacgcc aagcttggta ccgagctcgg atccactagt 60 
aacggccgcc agtgtgctgg aattcgccct tcaggcctaa cacatgcaag tcgaacggca 120 
gcacagggga gcttgctccc tgggtggcga gtggcggacg ggtgaggaat acatcggaat 180 
ctgcccagtc gtgggggata acctcgggaa accgggacta ataccgcata cgaccttagg 240 
gtgaaagcgg aggaccgcaa ggcttcgcgc gattggatga gccgatgtcg gattagcttg 300 
ttggcggggt aacggcccac caaggcgacg atccgtagct ggtctgagag gatgatcagc 360 
cacactggaa ctgagacacg gtccagactc ctacgggagg cagcagtggg gaatattgga 420 
caatgggcgc aagcctgatc cagccatgcc gcgtgagtga agaaggcctt cgggttgtaa 480 
agctcttttg tccggaaaga aaagctttcg gttaataccc ggaagtcctg acggtaccgg 540 
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aagaataagc accggctaac ttcgtgccag cagccgcggt aatacgaagg gtgcaagcgt 600 

tactcggaat tactgggcgt aaagcgtgcg taggtggttt gttaagtctg atgtgaaagc 660 

cctgggctca acctgggaat tgcactggat actggcaggc tagagtgcgg tagaggatgg 720 

cggaattccc ggtgtagcag tgaaatgcgt agagatcggg aggaacatct gtggcgaagg 780 

cggccatctg gaccagcact gacactgagg cacgaaagcg tggggagcaa acaggattag 840 

ataccctggt agtccacgcc ctaaacgatg cgaactggat gttgggagca actaggctct 900 

cagtatcgaa gctaacgcgt taagttcgcc gcctggggag tacggtcgca agactgaaac 960 

tcaaaggaat tgacgggggc ccgcacaagc ggtggagtat gtggtttaat tcgatgcaac 1020 

gcgaagaacc ttacctggcc ttgacatcca cggaacttac cagagatggt ttggtgcctt 1080 

cggnaaccgt gagacaggtg ctgcatggct gtcgtcagct cgtgtcgtga gatgttgggt 1140 

taagtcccgc aacgagcgca acccttgtcc ttagttgcca gcacgtaatg gtgggaactc 1200 

taaggagact gccggtgaca aaccggagga aggtggggat gacgtcaagt catcatggcc 1260 

cttacggcca gggctacaca cgtactacaa tggtcggtac agagggttgc aaagccgcga 1320 

ggtagagcca atcccagaaa accgatccca gtccggatcg aagtctgcaa ctcgacttcg 1380 

tgaagccgga atcgctagta atcgcggatc agaatgccgc ggtgaatacg ttcccgggcc 1440 

ttgtacacac cgcccaaggg cgaattctgc agatatccat cacactggcg gccgctcgag 1500 

catgcatcta gagggcccaa ttcgccctat agtgagtcgt attac 1545 



<210> 94 
<211> 1549 
<212> ADN 

<213> Organime Inconnu 



<220> 

<223> Origine de la sequence :Ozganisme du sol 



<400> 94 

ttttaaaccg acggccagtg aattgtaata 
agatgcatgc tcgagcggcc gccagtgtga 
taacacatgc aagtcgagcg gcagcgcggg 
ggaatgcatc ggaatctacc ctgtcgtggg 
gcatacgacc gagaggtgaa agtgggggac 
tgccggatta gctagttggt gaggtaaagg 
gagaggatga tcagccacat tgggactgag 
gtggggaata ttggacaatg ggcgcaagcc 
gccttcgggt tgtaaagcac ttttgttcgg 
ggatgacggt accgaaagaa taagcaccgg 
gaagggtgca agcgttactc ggaatcactg 
gtctgctgtg aaagccctgg gctcaacctg 
tgtgatagag gatggtggaa ttcccggtgt 
caccagtggc gaaggcggcc atctggatca 
agcaaacagg attagatacc ctggtagtcc 
gagcaacttg gctctcagtg tcgaagctaa 
tcgcaagact gaaactcaaa ggaattgacg 
ttaattcgat gcaacgcgaa gaaccttacc 
atggtttggt gccttcggaa ccgtgagaca 
gtgagatgtt gggttaagtc ccgcaacgag 
aatggtggga actctaagga gactgccggt 
aagtcatcat ggcccttacg gccagggcta 



cgactcacta tagggcgaat tgggccctct 60 
tggatatctg cagaattcgc ccttcaggcc 120 
gcaacctggc ggcgagcggc ggacgggtga 180 
ggataacgta gggaaactta cgctaatacc 240 
cgcaaggcct cacgcgatag gatgagccga 300 
ctcaccaagg cgacgatccg tagctggtct 360 
acacggccca aactcctacg ggaggcagca 420 
tgatccagcc atgccgcgtg tgtgaagaag 480 
gaagaaatcg tgcgggttaa tacccagtac 540 
ctaacttcgt gccagcagcc gcggtaatac 600 
ggcgtaaagc gtgcgtaggc ggttggttaa 660 
ggaactgcag tggatactgg ccagctagag 720 
agcggtgaaa tgcgtagaga tcgggaggaa 780 
acactgacgc tgaggcacga aagcgtgggg 840 
acgccctaaa cgatgcgaac tggacgttgg 900 
cgcgctaagt tcgccgcctg gggagtacgg 960 
ggggcccgca caagcggtgg agtatgtggt 1020 
tggccttgac atccacggaa cttaccagag 1080 
ggtgctgcat ggctgtcgtc agctcgtgtc 1140 
cgcaaccctt gtccttagtt gccagcacgt 1200 
gacaaaccgg aggaaggtgg ggatgacgtc 1260 
cacacgtact acaatggtcg gtacaagagg 1320 
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gttgcaaagc ccgcgaggta gagccaatcc cagaaaaccc gatcccagtc ccggatcgaa 1380 
gtctgcaact cgacttcgtg aagtcggaat cgctagtaat cgcggatcag aatgccgcgg 1440 
tgaatacgtt cccgggcctt gtacacaccg cccaagggcg aattccagca cactggcggc 1500 
cgttactagt ggatccgagc tcggtaccaa gcttggcgta atcatggtc 1549 



<210> 95 
<211> 1276 
<212> ADN 

<213> Organirae Inconnu 
<220> . 

<223> Origine de la sequence :Organisme du sol 
<400> 95 

ctggcggcga gcggcggacg ggtgaggaat acatcggaat ctacccagtc gtgggggata 60 
acgtagggaa acttacgcta ataccgcata cgacctgagg gtgaaagcag gggatcgcaa 120 
gaccttgcgc gattggatga gccgatgtcc gattagctag ttggtgaggt aaaggctcac 180 
caaggcgacg atcggtagct ggtctgagag ggtgatcagc cacactggaa ctgagacacg 240 
gtccagactc ctacgggagg cagcagtggg gaatattgga caatgggcgc aagcctgatc 300 
cagccatgcc gcgtgtgtga agaaggcctt cgggttgtaa agcacttttg ttcgggaaga 360 
aatcttccga gttaatacct cgggaggatg acggtaccgg aagaataagc accggctaac 420 
ttcgtgccag cagccgcggt aatacgaagg gtgcaagcgt tactcggaat tactgggcgt 480 
aaagcgtgcg taggtggttc gttaagtctg ccgtgaaagc cccgggctca acctgggaat 540 
tgcggtggat actggcggac tagagtgcgg tagagggtgg tggaattccc ggtgtagcag 600 
tgaaatgcgt agagatcggg aggaacatct gtggcgaagc ggccacctgg accagcactg 660 
acactgaggc acgaaagcgt ggggagcaaa caggattaga taccctggta gtccacgccc 720 
taaacgatgc gaactggacg ttgggagcaa ctaggctctc agtgtcgaag ctaacgcgtt 780 
aagttcgccg cctggggagt acggtcgcaa gactgaaact caaaggaatt gacgggggcc 840 
cgcacaagcg gtggagtgtg tggtttaatt cgatgcaacg cgaagaacct tacctggcct 900 
tgacatccac ggaatccttt agagatagag gagtgccttc gggaaccgtg agacaggtgc 960 
tgcatggctg tcgtcagctc gtgtcgtgag atgttgggtt aagtcccgca acgagcgcaa 1020 
cccttgtcct tagttgccag cgcgtaatgg cgggaactct aaggagactg ccggtgacaa 1080 
accggaggaa ggtggggatg acgtcaagtc atcatggccc ttacggccag ggctacacac 1140 
gtactacaat ggtggggaca gagggtcgcg aagccgcgag gtggagccaa tcccagaaac 1200 
cccatcctag tccggatcgg agtctgcaac tcgactccgt gaagtcggaa tcgctagtaa 1260 
tcgcggtcag catgcc 1276 



<210> 96 
<211> 1306 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence rOrgeUtiisme du sol 
<400> 96 

cagggatcag tagagtggca aacgggtgag taacgcgtgg gcgacctacc ttcgagtggg 60 
ggataacctt ccgaaaggag ggctaatacc gcatgacatc ccgtgtttgg atacacggac 120 
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atcaaagccg gggatcgcaa gacctggcgc 
ttggtgaggt cacggctcac caaggctccg 
cacactggga ctgagacacg gcccagactc 
caatgggcgc aagcctgacg acgcaacgcc 
actcctttcg accgagatga agacccgccg 
agggaagaag ccccggctaa ctccgtgcca 
ttgttcggaa ttactgggcg taaagggttc 
ccctcagctc aactggggaa ctgcgtctga 
gcggaattcc aggtgtagcg gtgaaatgcg 
gcggcgttct ggactgcaac tgacactgag 
gataccccgg tagtcctagc cctaaacgat 
gccgtgocgc agttaacgcg ataagcattc 
ctcaaaggaa ttgacggggg cccgcacaag 
cgcgaagaac cttacctagg ctcgaagtgc 
aagaacatct gtagaggtgc tgcatggctg 
aagtcccgca acgagcgcaa cccttgtttc 
ggagagactg ccggtgacaa accggaggaa 
ttatgtctag ggctacacac gtgctacaat 
ggtgagccaa tcgcagaaag ccggtctcag 
gaagttggaa tcgctagtaa tcgcggatca 



ttggagaggg gcccgcgtcc gattagctag 180 
atcggtatcc ggcctgagag ggcggacgga 240 
ctacgggagg cagcagtggg gaattgttcg 300 
gcgtggagga tgaagacctt cgggtcgtaa 360 
gcctaatacg ccggcggatt gacagtatcg 420 
gcagccgcgg taatacgggg ggggcaagcg 480 
gtaggtggct cgctaagtca gacgtgaaat 540 
gactggcaag cttgagtgca ggagaggaac 600 
tagatatctg gaggaacacc ggtggcgaag 660 
gaacgaaagc taggggagca aacgggatta 720 
gaatgcttgg tgtggcgggt atcgatccct 780 
cgcctgggga gtacggtcgc aaggctgaaa 840 
cggtggagca tgtggttcaa ttcgacgcaa 900 
agatgaccat cggtgaaagc cgactttcgc 960 
tcgtcagctc gtgtcgtgag atgttgggtt 1020 
ctgttgccat caggttaagc tgggcactct 1080 
ggtggggatg acgtcaagtc agcatggcct 1140 
ggccggtaca aagcgctgca aacccgcgag 1200 
ttcggatagc aggctgcaac tcgcctgctt 1260 
gcatgccgcg gtgaat 1306 



<210> 97 
<211> 1300 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origlne de la sequence :Organisme du sol 
<400> 97 

cccgcagggt gagtagatgg caaacgggtg agtaacacgt gggtgacctg cctcagagtg 60 
ggggataacg acccgaaagg gtcgctaata ccgcataaca tcctgtcttt ggatagacgg 120 
agatcaaagc cggggatcgc aagacctggc gcttagagag gggcccgcgg ccgattagct 180 
agttggtgag gtaacggctc accaaggcaa cgatcggtat ccggcctgag agggcggacg 240 
gacacactgg gactgagaca cggcccagac tcctacggga ggcagcagtg gggaattgtt 300 
cgcaatgggc gcaagcctga cgacgcaacg ccgcgtggag gatgaagatc. ttcgggtcgt 360 
aaactccttt cgatcgggaa gaacgcctct ggtgtgaaca ccatcagagg gtgacggtac 420 
cgagagaaga agccccggct aactctgtgc cagcagccgc ggtaatacag ggggggcaag 480 
cgttgttcgg aattactggg cgtaaagggc tcgtaggcgg ccggctaagt ccgacgtgaa 540 
atccccaggc ttaacctggg aactgcgtcg gatactggcg ggcttgaatc cgggagaggg 600 
atgcggaatt ccaggtgtag cggtgaaatg cgtagatatc tggaggaaca ccggtggcga 660 
aggcggcatc ctggaccggt attgacgctg aatagcgaaa gccaggggag caaacgggat 720 
tagatacccc ggtagtcctg gccctaaacg atgaatgttt ggtgtggcgg gtatcgatcc 780 
ctgccgtgcc gaagctaacg cattaaacat tccgcctggg gagtacggtc gcaaggctga 840 
aactcaaagg aattgacggg ggcccgcaca agcggtggag catgtggttc aattcgacgc 900 
aacgcgaaga accttaccca ggctcgaacg gcattggaca tccggcgaaa gccggctccc 960 
gcaagggccg atgtcgaggt gctgcatggc tgtcgtcagc tcgtgtcgtg agatgttggg 1020 
ttaagtcccg caacgagcgc aacccttgtc cgctgttgcc atcacgttat ggtgggcact 1080 
ctgcggagac tgccggtgat aaaccggagg aaggtgggga tgacgtcaag tcagcatggc 1140 
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ctttatgtct ggggctacac acgtgctaca atggccggta caaaccgttg cgatctcgca 1200 
agagtgagct aatcggagaa agccggtctc agttcggatt gcaggctgca actcgcctgc 1260 
atgaagttgg aatcgctagt aatcgcggat cagcacgccg 1300 



<210?. 98 

<211> 1233 
<212> ADN 

<213> Organiine Inconnu 
<220> 

<223> Origlne de la sequence rOrganlsme du sol 
<400> 98 

acggagcggc agacgggaga gtaacacgtg ggaacgtgcc ctttggttcg gaacaacaca 60 
gggaaacttg tgctaatacc ggataagccc ttacggggaa agatttatcg ccaaaggatc 120 
ggcccgcgtc tgattagcta gttggtgagg taacggctca ccaaggcgac gatcagtagc 180 
tggtctgaga ggatgatcag cctcactggg actgagacac ggcccagact cctacgggag 240 
gcagcagtgg ggaatattgg acaatgggcg caagcctgat ccagccatgc cgcgtggatg 300 
atgaaggccc tagggttgta aagtcctttc ggcggggaag ataatgacgg tacccgcaga 360 
agaagccccg gctaacttcg tgccagcagc cgcggtaata cgaagggggc tagcgttgct 420 
cggaatcact gggcngtaaa gcgcacgtag gcggcttttt aagtcagggg tgaaatcctg 480 
gagctcaact ccagaactgc ctttgatact gagaagcttg agtccgggag aggtgagtgg 540 
aactgcgagt gtagaggtga aattcgtaga tattcgcaag aacaccagtg gcgaaggcgg 600 
ctcactggcc cggtactgac gctgaggtgc gaaagcgtgg ggagcaaaca ggattagata 660 
ccctggtagt ccacgctgta aacgatggat gctagccgtt gtcgggttta ctcgtcagtg 720 
gcgcagctaa cgcattaagc atcccgcctg gggagtacgg tcgcaagatt aaaactcaaa 780 
ggaattgacg ggggcccgca caagcggtgg agcatgtggt tcaattcgaa gcaacgcgca 840 
gaaccttacc agcccttgac atgtcccgta tgagtaccag agatggaact cttcagttcg 900 
gctggcggga acacaggtgc tgcatggctg tcgtcagctc gtgtcgtgag atgttgggtt 960 
aagtcccgca acgagcgcaa ccctcgccct tagttgccat catttagttg ggcactctaa 1020 
ggggactgcc ggtgataagc cgcgaggaag gtggggatga cgtcaagtcc tcatggccct 1080 
tacgggctgg gctacacacg tgctacaatg gcggtgacag tgggatgcag aggggtaacc 1140 
ccgagcaaat ctcaaaaagc cgtctcagtt cggattgtgc tctgcaactc gagcacatga 1200 
agttggaatc gctagtaatc gcagatcagc acg 1233 



<210> 99 
<211> 1304 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 99 

cgaaatcccg cagggatcag tagagtggca aacgggtgag taacacgtgg gtgacctgcc 60 
ttcgagtggg ggataacgtc ccgaaaggga cgctaatacc gcatgacatc ctgctcttga 120 
acgagtggag atcaaagctg gggatcgcaa gacctagcgc tcaaagaggg gcccgcgcct 180 
gattagctag ttggtggggt aacggctcac caaggcgacg atcagtatcc ggcctgagag 240 
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ggcggacgga cacactggga ctgagacacg 
gaattgttcg caatgggcgc aagcctgacg 
cgggtcgtaa actcctttcg atcgagacga 
gacggtaccg agagaagaag ccccggctaa 
ggggcaagcg ttgttcggaa ttactgggcg 
gacgtgaaat ccctcggctt aaccggggaa 
ggagagggat gcggaattcc aggtgtagcg 
ggtggcgaag gcggcatcct ggaccaattc 
aacgggatta gataccccgg tagtcctggc 
atcgatccct gccgtgccga agctaacgca 
aaggctgaaa ctcaaaggaa ttgacggggg 
ttcgacgcaa cgcgaagaac cttacccagg 
gagcttccgc aaggacactc gtagaggtgc 
atgttgggtt aagtcccgca acgagcgcaa 
tgggcactct gcaaagactg ccggtgataa 
agcatggcct ttatgtctgg ggctacacac 
aaaccgtaag gtcgagctaa tcggagaaag 
tcgccggcgt gaagttggaa tcgctagtaa 



gcccagactc ctacgggagg cagcagtggg 300 
acgcaacgcc gcgtggagga tgaagatctt 360 
acggcctccg ggtgaacaat ccggaggagt 420 
ctccgtgcca gcagccgcgg taatacgggg 480 
taaagggctc gtaggcggcc aactaagtca 540 
ctgcgtctga tactggatgg ctagaggttg 600 
gtgaaatgcg tagatatctg gaggaacacc 660 
tgacgctgag gagcgaaagc caggggagca 720 
cctaaacgat gaatgcttgg tgtggcgggt 780 
ttaagcattc cgcctgggga gtacggtcgc 840 
cccgcacaag cggtggagca tgtggttcaa 900 
cttgaacagc gagtgaccac tcctgaaaag 960 
tgcatggctg tcgtcagctc gtgtcgtgag 1020 
cccttgtttg ctgttgccat cacgttatgg 1080 
accggaggaa ggtggggatg acgtcaagtc 1140 
gtgctacaat ggccggtaca aaccgtcgca 1200 
ccggtctcag ttcggatcgt cggctgcaac 1260 
tcgcggatca gcac 1304 



<210> 100 
<211> 1197 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisrae du sol 
<400> 100 

tctagtggcg cacgggtgcg taacgcgtgg gaatctgccc ttgggttcgg gataacagtt 60 
ggaaacgact gctaataccg gatgatgtct tcggaccaaa gatttatcgc ccagggatga 120 
gcccgcgtcg gattagctag ttggtgaggt aaaggctcac caaggcgacg atccgtagct 180 
ggtctgagag gatgatcagc cacactggga ctgagacacg gcccagactc ctacgggagg 240 
cagcagtggg gaatattgga caatgggcga aagcctgatc cagcaatgcc gcgtgagtga 300 
tgaaggcctt agggttgtaa agctcttttg cccgggatga taatgacagt accgggagaa 360 
taagccccgg ctaactccgt gccagcagcc gcggtaatac ggagggggct agcgttgttc 420 
ggaattactg ggcgtaaagc gcacgtaggc ggctttgtaa gttagaggtg aaagcccgga 480 
gctcaactcc ggaactgcct ttaagactgc atcgcttgaa cgtcggagag gtaagtggaa 540 
ttccgagtgt agaggtgaaa ttcgtagata ttcggaagaa caccagtggc gaaggcgact 600 
tactggacga ctgttgacgc tgaggtgcga aagcgtgggg agcaaacagg attagatacc 660 
ctggtagtcc acgccgtaaa cgatgatgac tagctgtcgg ggctcatgga gtttcggtgg 720 
cgcagctaac gcgttaagtc atccgcctgg ggagtacggc cgcaaggtta aaactcaaag 780 
aaattgacgg gggcctgcac aagcggtgga gcatgtggtt taattcgaag caacgcgcag 840 
aaccttacca gcgtttgaca tggtaggacg gtttccagag atggattcct tcccttacgg 900 
gacctacaca caggtgctgc atggctgtcg tcagctcgtg tcgtgagatg ttgggttaag 960 
tcccgcaacg agcgcaaccc tcgtctttag ttgctaccat ttagttgggc actctaaaga 1020 
aactgccggt gataagccgg aggaaggtgg ggatgacgtc aagtcctcat ggcccttacg 1080 
cgctgggcta cacacgtgct acaatggcgg tgacagtggg cagcaaactc gcgagagtga 1140 
gcaaatcccc aaaaaccgtc tcagttcgga ttgttctctg caactcgaga gcatgaa 1197 
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<210> 101 
<211> 1352 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 101 

cgacggccag tgaattgtaa tacgactcac tatagggcga attgggccct ctagatgcat 60 
gctcgagcgg ccgccagtgt gatggatatc tgcagaattc gcccttcagg cctaacacat 120 
gcaagtcgca cgagaaaggg cttcggcccc ggtacagtgg cgcacgggtg agtaacacgt 180 
aggcaatctc ccctcgagtg gtggataacc ttccgaaagg agggctaata cagcatgaga 240 
ccacgagctc gcagagcttg tggccaaagc ggacctcttc ttgaaagttc gcgcttgagg 300 
atgagcctgc ggcccatcag ctagttggta gggtaatggc ctaccaaggc taagacgggt 360 
agctggtctg agaggacgga cagccacact ggaactgaga cacggtccag actcctacgg 420 
gaggcagcag tggggaatct tgcgcaatgg acgaaagtct gacgcagcga cgccgcgtga 480 
gcgatgaagg ccttcgggtt gtaaagctct' gtggggagag acgaataagg tgcagctaat 540 
acctgcatcg atgacggtat ctccttagca agcaccggct aactctgtgc cagcagccgc 600 
ggtaagacag agggtgcaaa cgttgttcgg aattactggg cgtaaagcgc gtgtaggcgg 660 
ctgtgtaagt cgggcgtgaa atcccatggc tcaaccatgg aagtgcaccc gaaactgcgt 720 
agctagagtc ctggagagga aggtggaatg cttggtgtag aggtgaaatt cgtagatatc 780 
aagcggaaca ccggtggcga agcggccttc tggacagtga ctgacgctga gacgcgaaag 840 
cgtggggagc aaacaggatt agataccctg gtagtccacg ccgtaaacga tgaatgctag 900 
acgctggggt gcatgcactc cggtgtcgcc gctaacgcat taagcattcc gcctggggag 960 
tacggccgca aggttaaaac tcaaaggaat tgacgggggc ccgcacaagc ggtggagcat 1020 
gtggtttaat tcgaagcaac gcgcaaacct taccaaccct tgacatgtcc attgccggtc 1080 
cgagagattg gaccttcagt tcggctggat ggaacacagg tgctgcatgg ctgtcgtcag 1140 
ctcgtgtcgt gagatgttgg gtCaagtccc gcaacgagcg caacccctac cgccagttgc 1200 
catcattcag ttgggcactc tggtggaact gccggtgaca agccggagga agcggggatg 1260 
acgtcaagtc ctcatggccc ttatgggttg ggctacacac gtgctacaat ggcggtgaca 1320 
gtgggacgcg aagtccaaga tggacaaatc cc 1352 



<210> 102 
<211> 1361 
<212>- ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la s€c[uence lOrgemisme du sol 
<400> 102 

aacagctatg accatgatta cgccaagctt ggtaccgagc tcggatccac tagtaacggc 60 
cgccagtgtg ctggaattcg cccttcaggc ctaacacatg caagtcgaac ggatccttcg 120 
ggattagtgg cggacgggtg agtaacacgt gggaacgtgc cctttggttc ggaacaactc 180 
agggaaactt gagctaatac cggataagcc tttcgaggga aagatttatc gccattggag 240 
cggcccgcgt aggattagct agttggtgag gtaaaagctc accaaggcga cgatccttag 300 
ctggtctgag aggatgatca gccacattgg gactgagaca cggcccaaac tcctacggga 360 
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ggcagcagtg gggaatcttg cgcaatgggc 
gatgaaggcc ttagggttgt aaagctcttt 
aagaagcccc ggctaacttc gtgccagcag 
tcggaattac tgggcgtaaa gcgcacgtag 
gagctcaact ctggaactgc ctttgatact 
aattccgagt gtagaggtga aattcgtaga 
cttactggtc cattactgac gctgaggtgc 
ccctggtagt ccacgccgta aacgatgaat 
gcgcagctaa cgcattaaac attccgcctg 
ggaattgacg ggggcccgca caagcggtgg 
gaaccttacc agctctfcgac attcggggtt 
gctggcccca gaacaggtgc tgcatggctg 
aagtcccgca acgagcgcaa ccctcgccct 
ggggactgcc ggtgataagc cgagaggaag 
tacgggctgg gctacacacg tgctacaatg 
tcgagctaat ctccaaaagc catctcagtt 
gttggaatcg ctagtaatcg cagatcagca 



gcaagcctga tccagccatg ccgcgtgagt 420 
caccggagaa gataatgacg gtatccggag 480 
ccgcggtaat acgaaggggg ctagcgttgt 540 
gcggatattt aagtcagggg tgaaatccca 600 
gggtatcttg agtatggaag aggtaagtgg 660 
tattcggagg aacaccagtg gcgaaggcgg 720 
gaaagcgtgg ggagcaaaca ggattagata 780 
gttagccgtc gggcagtata ctgttcggtg 840 
gggagtacgg tcgcaagatt aaaactcaaa 900 
agcatgtggt ttaattcgaa gcaacgcgca 960 
tgggcagtgg agacattgtc cttcagttag 1020 
tcgtcagctc gtgtcgtgag atgttgggtt 1080 
tagttgccag catttagttg ggcactctaa 1140 
gtggggatga cgtcaagtcc tcatggccct 1200 
gtggtgacag tgggcagcga gacagcgatg 1260 
cggattgcat ctgcaactcg agtgcatgaa 1320 
tgctgcggtg a 1361 



<210> 103 
<211> 1300 
<212> ADN 

<213> Organirae Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 103 

catgtttagt agcaatacta aatgatgacg agcggcggac gggtgaggaa cacgtaggaa 60 
cctgcccaag agagggggac aaccaaggga aactttggct aataccgcat aatctctacg 120 
gagaaaagtt gcccgtaagg gtggcgcttt tggaggggcc tgcgtccgat tagttagttg 180 
gtgaggtaat agctcaccaa gactgtgatc ggtaactggt ctgagaggac gaccagtcac 240 
actgggactg agacacggcc cagactccta cgggaggcag cagtggggaa tcttggacaa 300 
tgggggcaac cctgatccag cgatgccgcg tgggtgaaga aggccttcgg gttgtaaagc 360 
cctttaggcg gggaagaagg atatgggatg aataagcctg tattttgacg gtacccgcag 420 
aataagcacc ggcaaactct gtgccagcag ccgcggtaat acagagggtg cgagcgttaa 480 
tcggatttac tgggcgtaaa gggcgcgtag gcggttgtgt gagtgtgatg tgaaagcccc 540 
gggctcaacc tgggaagtgc atcgcaaacg acacaactgg agtatatgag agggtggcgg 600 
aatttccggt gtagcggtga aatgcgtaga gatcggaagg aacgtcgatg gcgaaggcag 660 
ccacctggca taatactgac gctgaggcgc gaaagcgtgg ggagcgaaca ggattagata 720 
ccctggtagt ccacgccgta aacgatgaga actagatgtt ggagggggaa cccttcagta 780 
tcgaagctaa cgcgataagt tctccgcctg ggaagtacag tcgcaagact gaaactcaaa 840 
agaattgacg ggggcccgca caagcggtgg agcatgtggt ttaattcgat gcaacgcgaa 900 
gaaccttacc tacccttgac atcctgcgaa tcttgccgag aggtgagagt gccgcaagga 960 
gcgcagagac aggtgctgca tggctgtcgt cagctcgtgt tgtgagatgt tgggttaagt 1020 
cccgtaacga gcgcaaccct tgtccttagt tgccatcatt tagttgggga ctctaaggag 1080 
accgccggtg atgaaccgga ggaaggcggg gacgacgtca agtcatcatg gcctttatgg 1140 
gtagggctac acacgtgcta caatggggcg tacagagggt cgccaacccg cgagggggag 1200 
ccaatctctt aaagcgtctc gtagtccgga ttggagtctg caactcgact ccatgaagtc 1260 
ggaatcgcta gtaatcgcgg atcagcagtg ccgcggtgaa 1300 



wo 01/40497 



61 



PCTAFROO/03311 



<210> 104 
<211> 1250 
<212> ADN 

<213> Organ'ime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 
<400> 104 

tgtagcaata catcagtggc agacgggtga gtaacacgtg ggaaccttcc tcgttgtacg 60 
ggacaactca gggaaacttg agctaatacc gtatacgtcc gagaggagaa agatttatcg 120 
caatgagacg ggcccgcgtc ggattagcta gttggtaagg taacggctta ccaaggcgac 180 
gatccgtagc tgatctgaga ggatgatcag ccacactggg actgagacac ggcccagact 240 
cctacgggag gcagcagtgg ggaatcttgg acaatgggcg caagcctgat ccagccatgc 300 
cgcgtgagtg aagaaggcct tagggttgta aagctctttt gccagggacg ataatgacgg 360 
tacctgagaa taagccccgg caaacttcgt gccagcagcc gcggtaatac gaagggggct 420 
agcgttgttc ggatttactg ggcgtaaagc gcacgtaggc gggtcgttaa gtcaggggtg 480 
aaatcccgga gctcaactcc ggaactgcct ttgatactgg cgaccttgag gctggaagag 540 
gttagtggaa ttcccagtgt agaggtgaaa ttcgtagata ttgggaagaa caccagtggc 600 
gaaggcggct aactggtcca gatctgacgc tgaggtgcga aagcgtgggg agcaaacagg 660 
attagatacc ctggtagtcc acgccgtaaa ctatgggtgc tagctgtcag cgggcttgct 720 
cgttggtggc gcagctaacg cattaagcac cccgcctggg gagtacggtc gcaagattaa 780 
aacttaaagg aattgacggg ggcccgcaca agcggtggag catgtggttt aattcgaagc 840 
aacgcgcaga accttaccaa cccttgacat cccgatcgcg gacaccagag atggagtcct 900 
tcagttcggc tggatcggag acaggtgctg catggctgtc gtcagctcgt gtcgtgagat 960 
gttgggttaa gtcccgcaac gagcgcaacc ctcgccttta gttgccatca tttagttggg 1020 
cactctaaag ggactgccgg tgataagccg gaggaaggtg gggatgacgt caagtcctca 1080 
tggcccttac gggttgggct acacacgtgc tacaatggcg gtgacaatgg gcagctactt 1140 
cgcaaggaga agctaatccc aaaaagccgt ctcagttcag attgcactct gcaactcggg 1200 
tgcatgaagt tggaatcgct agtaatcgct aatcagcagg tagcggtgaa 1250 



<210> 105 
<211> 1302 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origine de la sequence :Organisme du sol 

<400> 105 

ggcttcggct ccccggtaga gtggcggacg ggtgagtaac acgtgggtaa 
ggtggggaat aacccttcga aagaggggct aataccgcat aacgcagcgg 
tgacagttgt taaagtgggg gatcgcaaga cctcacgcct gaagaggagc 
ttagctagtt ggtgcggtaa tggcgtacca aggcggcgat cggtagccgg 
cggacggcca cactggcact gagagacggg ccagactcct acgggaggca 
attttgggca atgggcgcaa gcctgaccca gcaacgccgc gtgaaggacg 
gggatgtaaa cttcgaaagt tggggaagaa atccgtgtga ggataatgca 



tctgcctttg 60 
caccgaatgg 120 
ccgcgcccga 180 
cctgagaggg 240 
gcagtgggga 300 
aaatccctct 360 
cacgggatga 420 
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cggtacccaa cgtaagcccc ggctaactac 
caagcgttgt tcggaattac tgggcgtaaa 
tgaaagcccg gggctcaacc ccggaatgtc 
aggcatctgg aattcccagt gtagcggtga 
gcgaaggcgg gatgctgggc cgacactgac 
ggattagata ccccggtagt cctggcccta 
gaagtccccg cgtgccggag ctaacgcggt 
ggctgaaact caaaggaatt gacggggacc 
cgacgcaacg cgaagaacct tacctgggtt 
tttcccttcg ggggaggtag gacggtgctg 
gttgggttaa gtcccgcaac gagcgcaacc 
gcactctatt gggactgccg gtgacaaacc 
atggccttta tgtccagggc tacacacgtg 
ccgcgagggg gagccaatcg caaaaatccg 
actccatgaa gttggaatcg ctagtaatcg 



gtgccagcag ccgcggtaat acgtaggggg 480 
gggcgcgtag gcggtacgac aagtctggag 540 
tttggaaact gtcgaacttg agtgcggaag 600 
aatgcgtaga tattgggaag aacacctgag 660 
gctgaggcgc gaaagccagg ggagcgaacg 720 
aacgatggat acttggtgtg tggggttctc 780 
aagtatcccg cctggggagt acggtcgcaa 840 
cgcacaagcg gtggagcatg tggttcaatt 900 
aaatcctacc tcgtcgcctc agagatgagg 960 
catggctgtc gtcagctcgt gccgtgaggt 1020 
cttaccacta gttgccagcg gttcggccgg 1080 
ggaggaaggt ggggatgacg tcaagtcatc 1140 
ctacaatggc cggaacaaag cgcagcaaac 1200 
gtctcagttc ggattggagt ctgcaactcg 1260 
cggatcagca tg 1302 



<210> 106 
<211> 1281 
<212> ADN 

<213> Organime Inconnu 
<220> 

<223> Origlne de la sequence :Organisme du sol 
<400> 106 

tgcttctctt gagagcggcg gacgggtgag taatgcctag gaatctgcct ggtagtgggg 60 
gataacgttc ggaaacggac gctaataccg catacgtcct acgggagaaa gcaggggacc 120 
ttcgggcctt gcgctatcag atgagcctag gtcggattag ctagttggtg aggtaatggc 180 
tcaccaaggc gacgatccgt aactggtctg agaggatgat cagtcacact ggaactgaga 240 
cacggtccag actcctacgg gaggcagcag tggggaatat tggacaatgg gcgaaagcct 300 
gatccagcca tgccgcgtgt gtgaagaagg tcttcggatt gtaaagcact ttaagttgga 360 
aggaagggca gtaaattaat actttgctgt tttgacgtta ccgacagaat aagcaccggc 420 
taactctgtg ccagcagccg cggtaataca gagggtgcaa gcgttaatcg gaattactgg 480 
gcgtaaagcg cgcgtaggtg gtttgttaag ttggatgtga aatccccggg ctcaacctgg 540 
gaactgcatt caaaactgac tgactagagt atggtagagg gtggtggaat ttcctgtgta 600 
gcggtgaaat gcgtagatat aggaaggaac accagtggcg aaggcgacca cctggactaa 660 
tactgacact gaggtgcgaa agcgtgggga gcaaacagga ttagataccc tggtagtcca 720 
cgccgtaaac gatgtcaact agccgttgga agccttgagc ttttagtggc gcagctaacg 780 
cattaagttg accgcctggg gagtacggcc gcaaggttaa aactcaaatg aattgagggg 840 
ggcccgcaca agcggtggag catgtggttt aattcgaagc aacgcgaaga accttaccag 900 
gccttgacat ccaatgaact ttctagagat agattggtgc cttcgggaac attgagacag 960 
gtgctgcatg gctgtcgtca gctcgtgtcg tgagatgttg ggttaagtcc cgtaacgagc 1020 
gcaacccttg tccttagtta ccagcacgac atggtgggca ctctaaggag actgccggtg 1080 
acaaaccgga ggaaggtggg gatgacgtca agtcatcatg gcccttacgg cctgggctac 1140 
acacgtgcta caatggtcgg tacagagggt tgccaagccg cgaggtggag ctaatcccac 1200 
aaaaccgatc gtagtccgga tcgcagtctg caactcgact gcgtgaagtc ggaatcgcta 1260 
gtaatcgcga atcagaaatg t 1281 
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<210> 107 
<211> 43 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la s€quence artificielle: amorce 
<400> 107 

cgctgcagat ttaaatatgc aacgcgtaag tcgatggcgt teg 

<210> 108 
<211> 51 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce 
<400> 108 

cggtcaactt aattaagata tctcgagaga tctattaata cgatacctgc 

<210> 109 
<211> 29 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce 
<400> 109 

aaaaagatat ctgacgtccc gaaggcgtg 



<210> 110 
<211> 32 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: amorce 
<:400> 110 

aaaaaagatc tggctaacta actaaaccga ga 



<210> 111 
<211> 36 
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<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la siquence artificielle: amorce 
<400> 111 

gtgccgttaa ttaagctccg cgaagtcgct cttctt 36 



<210> 112 
<211> 36 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 112 

gtgccgttaa ttaaccgctg cataaccctg cttcgg 36 



<210> 113 
<211> 42717 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle :cosmide 
a26gl brin non codant 

<400> 113 

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaacc gggccctgac 60 
gttcagaact ccccgcgaga atctctcggc agagcgcctg cacctcgact tcaccggcag 120 
tgtcgagatc gatgcaggtg caagcgaact cgggatgctc ggccgcgatg gtacgtccca 180 
gaccccacac cggtgcccgc gcgggcacca ccggcatctg cagatgctcc gcatgaacgc 240 
ccgccgtaat cagccagatt cgcggatgct gcgattcggc gtcggacgct tgtttcgtca 300 
gctgtatgcg tcccactccg aattcttgaa cgatgcgcaa aatgtcttcg caggcggttc 360 
cccccgcagc cgacggatcg gtctcatcct cggtctcatc caggctcccg cagtgaatga 420 
cgccccggta aggctgatcc ggtatctcgg catcgcgacc cgaaatcaca accgtgtttg 480 
tgcccagccc tcgcgccacc gcggctgcga tgccgccggc atcggcaatg accagccatg 540 
cacccgacac cgttgccgtt ggactctcgg ccagcagctg cggctcccat tccatagcgt 600 
ggaaccattc ggattggcgc tccagttcct gggcacgcag gccttggacc tcgaggatga 660 
cgtggccttc cgcatcacac agggtgacat cgccctcgag ccgccccgtc agccgcgcat 720 
gcaccctaag atcgccggcg ggtctgccga aacagtgcaa ccgttcgatg gcgacaggca 780 
cgcaaggacc ggcgctgcct tcgccgccaa gcgtcgcgcc cagcacctgc aaacaggcat 840 
cgagcaaggc aggatgaagc gtgtaaccgg actctgcttc gcgaacggca tccggcacgc 900 
tcagtcgcgc cactgcctcg ccgtcgcgcc gccacacttc cgcgatgccg cggaaggtgt 960 
cgccgtaatg catcccctgc gatgcgaagg ccgcatagaa gtcatcgccc tcgatgcgat 1020 
ccccaagtgt gggcaggctc accgtgggcg cgaccttgtc cggcgccgca gccatggtgc 1080 



wo 01/40497 



65 



PCTAFROO/03311 



cgcgcgcgtg ctcggtccaa tcggaaccgc cttcggccag acbggagatg cggaatgcgt 1140 
gtccctcgag tatgacctgc actcgcgagg cgcccgcgga aggaacaacc agcatttgtt 1200 
caaaccggat ctcttccagg ctgcagccac ccgcgaacac ttccttggct gcggccagcg 1260 
ccatctccac ataagcggca ccgggaagca ccacaagctc gttgagccgg tgatcggcga 1320 
gaaacggcag cgcatccaga gagagcacgg actcccagac gtgtgtgtcc ggcgccagcg 1380 
caatctcgac cttgcgaccg agcagcggat gaccgccaac tgccggcaaa cttcgccgcg 1440 
tcgaggtcgc gaaccagaag cgctcgcgct gccagggata cgtcggcaga tccaggcgcg 1500 
tgtcgggaga cgaagcgagc gcgcgccagt ccggacgctg cccattcacg tagagcgcgg 1560 
cgagcaactc gagcagctca cgccgctccg gttcgtcgcg gcgcagtacg gggcgaacca 1620 
gtccgtttat gccgagcgtc cgcagactat cctcgatcga cggcgtcagc acaggatgcg 1680 
gactgatctc caggaactgc gtgaactcat caccagccat cgcctgcaac gactcccaga 1740 
aacggactgg ctgtcgcaga ttggctaccc agtacgacgc gtcgcacgcc tcgcccgtgc 1800 
tcaactgtcc ttcaaccgtg gagaagaacg gcacggcgga acgttttgca ataacgcggc 1860 
cgagttcctg gcgcaattcg ttctcgagcg ggtccacctg cgagctgtgt gaagcgacat 1920 
ccacctgaat cagccggcag aagacgccgc gcctctcgaa gtcgtccttc aaatgctcga 1980 
gagccacacg gtctcccgag aacaccgtgc tgcgtggtcc gttgctggcc gcgacagaaa 2040 
cagtagtgag accgcgttca gcgagcacgg ccttcgcccg atcgagcggc agttcgacca 2100 
gagccatcgc tccccggccg cgaagtccga gcaacagccg gctgcggcga cagatgatgc 2160 
gggccgcgtc ctccagggtg agaatgcctg cgacatgggc cgccgccact tctcccatgc 2220 
tgtgtccggc cacgccgtcc gggcgaattc cccaggattg cagcagttcg accagcgcga 2280 
tttgaacggc gaacagcgca ggctgcacgc gatcgatctg gctcagccat gctcccgact 2340 
cgtcggcgag caggtccgca agccgccatt ccacgaagct gcggaaggcg gcgtcgcaac 2400 
gttcgatcgc cgatcggaag acaggctcgt cggaatacag gcgatacgcc atgcgcgggt 2460 
actgtccgcc ctggccggaa aagatgaagg cgagtttcgg acgaactccg ggatcggcga 2520 
aaccggtggc gacgccgcga ttggtttcat tgcgccggaa ggcctcgagc aattgattga 2580 
actcgggcag ggatgaggcc acaaacgctg cgcgatgttc gtagtgactg cgcgtcaggc 2640 
tggcggcgga acacagcgcg gagagcggag cgtgaaagcg cccatcgcga taggcgccgg 2700 
cgagatcgcg cagagcctgc ggatggcgcg ccgaaagcgg taggaggtat tcgcggccgt 2760 
cttcggcatg gagttgatcc gggaccggca cttcctcgcg gctgggcggc cggcccgacc 2820 
ccccgccgcc gcttcgcggg cggctgtccc cctcgaggag ggggacacta gcactagcct 2880 
tagcctccac attccctttg gcctctacac tcgccttgac ctcttcactc gtcttcgcct 2940 
ctacattcgt cttcgcctct acattcgtct tcgcttctac attcgtcttc gcttctgcga 3 000 
ggacgacgtg cgaattggtg ccactgattc cgaacgagct caccccggca actcgggggc 3060 
ggccgttgga gggccatggc gaacatgcgg tggctatctt tagcggcagc tcattccaga 3120 
gtacgtgcgg gttgggcgcg ttgaaatgca gatggggcgg aatctctcgg tgctgcaggg 3180 
cgagaatggt cttgatcagg ccggcgatac ctgccgccgc ctccaggtgg ccgaagttgg 324 0 
ttttcaccga cccgacgatc aacggagaat cgacggcacg cccctcgccc agcaccgctg 3300 
ccatcgcccg cagttcgatg ggatctccca gcggcgtccc ggttccgtgg gcttccacgt 3360 
aatcgacatc ggcgggggcc atgccggcgt tcttgagcgc cgcccgaatc acggcttcct 3420 
gcgccggacc gttcggcgcc gtgaggccgt tgctgcggcc gccgtggttg acggccgatc 3480 
cgcgaatcag cgccagaata cgatcgccgt cacgcgtcgc atcggacagc cgcttcagca 3540 
ccagcattcc gcatccctcg ccgcggccgt aaccgtcggc ggaggcagcg aaacttttgc 3600 
aacggccatc ggccgccatg gcccgcaggc ggcagaagta gatcgtgctt tccggcgcca 3660 
gaatcaggtt cacgccgccg gccagcgcca tgctgcactc tcgcgactgc aagctgcggc 3720 
acgccagatg aaccgccacg agtgaggaag agcacgccgt gtcgacgggg aagttcggtc 3780 
cctgcaaccc cagcagatag gagatccgtc cggcggcagt gctgaacgcg gttccggtac 3840 
cggtataggc gtcaatgagc gccggatcgg taggtttcag ccggctgtag tcgtcggtgc 3900 
tgatcccgat gaacactccg gtgtcgctgc ccgcgagact gtcgggcggc cgacccgcac 3960 
gctccaaagc ttcccatgcc acctcgagca gcaggcgctg ctgcggatcc agaccggcga 4020 
cctcgcgcgg cgtgattccg aagaagccgg cgtcgaagcc gtcgacggca ccatcgagga 4080 
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atccgcccag acgcgtgtac atctttcccg gcgcgttggg atcgggatcg taaaacgcat 4140 
cggcatccca acggcccgca ggaatttcgc ggatggcatc gatgccatcg tgcaggagct 4200 
gccaaaatgc ttccggcgag tccgcgccgg gaaagcggca agccatgccg acgatcgcga 4260 
tgggttcgtt gtggacgctc tccagttcgt cgagacgcgc tcgcgtgcgc ttgagcgcca 4320 
ggaccgcctg ttgaagagga gtgagatcgc tcatcgttcc tctcccagat ggtgcaaggt 4330 
ttccgtgatg aacgccgcca tctcctgctc ggacagctgc cgcacttcat cgacgaggga 4440 
atcgctgggg acgtcgagtc cgagttcgcg gaggacatgg ccggccaatt tctcgacggt 4500 
cggatggtcg tatagcaatg tcgcgggaag gctcttgcgc accagctctc cgatggcgcg 4560 
cgccagatcc agcgccatca gcgaatcgag tccgtattcc ttgagcggcc ggcgcgggtc 4620 
gagcgtcttg gacgcatcga gcgccagcac gccgccggcc tgcttgcgga tgcgcatctg 4680 
cagcagttcc tgccgccgct ccggcgcagc ttcggtgagt tgctggatga agccgggatc 4740 
gctcgccggg ctccgccttt tttcggcgga gacttggaac accgcgatct gagcggcagt 4800 
ctcgcccagc agatcgccga agatgcgcgc acccacttcc ggcggcagca gcggtacccc 4860 
cggcaggcct tgccgcgcga tgcgcgcggc catgccttcg cccgcccatg gtccccaatt 4920 
gatgctcagc gccggtagtc cttgcgcgcg gcgcatgtgg gcaaggctgt cgagaaatgc 4980 
gttggccgcc gagtaattgc tctgtccggc ggaaccgagc agcgaagcgg cggaagagaa 5040 
gagtacgaaa aagtcgagcg catggtggcg agtgagctgg tgaagattcc aggcaccctg 5100 
cagcttcggc gccagcacct tctcgaaacg agcccacgtc tgttctgtaa ctaccccgtc 5160 
atcgagcacg cctgcggcat gcacgactcc acgcagcggc tgggtgcgcg ggtccgccag 5220 
cagcgccgcc agctgttgct cggaactcac atcgcaagca gcaaccatga ctgcagcccc 5280 
gagttgctcg agatcggcaa ctgcctccgt atgccggccg accagtacca gacggcgcgc 5340 
gccttgctcg atcaagcggc gtgccaccct tcgtcctaat gcgccgagac cgccggtgat 5400 
cagatagacg ccgtcggctg aaatggcagg cggccgcttc gacgtttcct tgtgccgcac 5460 
cagccggcga acgtagcggc gtccgttgcg caatgcgatc gctttgtcgt cgccggcata 5520 
acggatttca tccagcagca tggcggcggc gatgtcggca ttgtcgcaac cgaggtcgat 5580 
caggccgccc cacagctcgg gatgctcgcg cgcgatcgcc tgcccgagtc cccacagtgg 5640 
agcctggaaa ggatcgacgg gagtcgcatc gtcatcactg atgcgatgca cgccgcgcgt 5700 
gatcagccag agccgcgccg ggcggccgac caaagtctgg gtctgttcca gcgcctggcg 5760 
gagagtgacg ccggacacga cgcgcagctc ttgcggcatc aaaccggcga catcgtctgc 5820 
gccggcacac agcaaccagt cctccggctt gccagggccg tcggacttca acgttgtcga 5880 
tcgctcgcac tcctgccact gcacatcctg cagccacgac tgtgcggatt gcagcgtacc 5940 
ggcatgcatt acagccagtc cggaaaactc ggcgatgacc gcgccggtct cttcaaccag 6000 
cgtcagatca ccgacgaacg ggccgctcga gctcgggcgc agacgcgcat gacagcgcag 6060 
agaacctgcc ggcggacggt agaagcgcac cgcttcgatc ccgaccggca cgtatgcgcc 6120 
gggctggcaa cgctccgcgg gccaagtcgc tccgaatact tgaaaacaag aatcgatcag 6180 
gccggggtgc agccggtaag cgttcgcgcc atcctcagcc accggcagac gcattcgccc 6240 
cagcgcctcg ccatcgcgac gccagacttc ttccacccaa ctgaaggcgg ggccaagatc 6300 
gacgccgcgt gcgttcatcg cgccgtagaa cgcatcgccg gaaatgactt cggaaggctg 6360 
cgccggcagc tcgaaatgaa cggcgccggc agtcgccgcg cgcagactgg ctgccgtgtg 6420 
gagcttccac gaatcgccat cctggctgaa gacctgcacc tttgcttcgc cgtcctcgcc 6480 
99gtgtgaca atcgcttgca ccgtgaccgg cgtatccggc gggatggcca gtgcctgccg 6540 
catcatgaca tcggagacgg cgcagggaac cggaccgaag acttcctgtg ccgcttcgag 6600 
aaatgccgac acgtgccagg cgccgggcac aatgaccgcg tcgtagatca cgtgc'tcatg 6660 
gagcagaggc gtctccgtgg ttagcgaatt ttcgaagatg acatcgccca acgcgctgtt 6720 
gaggcgcgct cccaacatgc cgccgcgcgc cggctctctc gcgggtacgc gtctcaggct 6780 
gaaggtgtca cgctgaaacg gatacgtcgg cagcgcgacg cggctgggtg attccccggc 6840 
atagagaccg cgccagtcgg gattcacgcc cgcggtaaac aggccgccaa gactttccag 6900 
cagcacggac caatccgatc gtcccttaga tagggagtgc agccagaccg cgccgtcatc 6960 
gggcagacaa tatcgcccca gcgtggtgag cgtgggatgc gggccgattt ccagaaacag 7020 
cttgcactcg cggtccgcca gggttcgcat cgcgctttca aactgcacgg tttcgcgcaa 7080 
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ctgtcgccgc cagtagcggg cgtcgagtgt cgtgcctttc ggcaatacgg ctccgctgac 7140 
gttcgacacc agcgggatcg ccagcggctg atacgcgatc gcacctgcaa gcgcttcgaa 7200 
cttgtccaaa atcggatcca tcagcggcga atggaacgca tgcgatacgt tcagctctcg 7260 
cgtttccacg ccggcgcgat gcaggtcatc ttgcgcttcc gcgatttctg cagccgtgcc 7320 
ggagatcacg gtgcggtccg gcgcattcga tgcggcgact gccaccttgg cggcgagcgc 7380 
cgcgatgcgg ctcggattgg cgtgaacgat gaccgctttg ccgcggggaa gcgcattgac 7440 
cagccgcccc ctggcggtca ccagccgcag gccgtcctcc acgctaaagg cgccggccac 7500 
acacgccgca acatactcgc cgagactgtg gcccagcacg tagtccggcc ggacgccgag 7560 
cgacagccag aactgagcca gagcccattc cagggcaaac attgccggct gggtatacgc 7620 
cgtctcgtgc aacggcgaaa ccgactcgaa caagagaacg gtcagcggaa catcgagctg 7680 
gggacggagc caatcggcgc aacgatcgag cgcgtcgcga aaaacaggct gcgttttata 7740 
aagctctgcg cccatgccgg cgtactgcgc gccctggccg gtgaagagaa aagcgattgc 7800 
cggccgccgg cgcaacgata cttcgcgccg cggcgccgcg gccaatgccg ctacagcctc 7860 
tgccgcatct gcggcggtga tcgccaagcg gtgactatat gcgtcgcgcc caacctgact 7920 
ggtgaagcaa acgtcggaca gcaacgcatt cgggtgcgac tgcaggaact ccgcgaagtg 7980 
gccggccagt tcgccgagcg cttcgtcggt gcgcgccgac agagtgagaa gctgcgggcg 8040 
tgtgaccggc ttcggcaaag ggagtgcagg cgcctcttcg aggatgacgt gcgcgttgct 8100 
ccctccaaaa ccgaacgagc tgacgccggc cagacgcggc cgtccttccg acgtccacgg 8160 
cgacgattcc gtggcgatgc gaaaccggct gccgtccagt gagatgttcg gattcagccg 8220 
gcgaaaatgc aggtgcggag gaatggtgcg atgctgcagg gcgagtacgg ctttgatcag 8280 
cccggcgatt cccgccgcgc cctccagatg cccgatgttg gtctttacgg aacccagcag 834 0 
acaaggcgca gagtccggcg cgtcgtagac cgactgcagg gcctcgatct cgataggatc 8400 
gcccagcgac gtgcccgtgc catgcgcctc gatcaacgat acgtgggatg gatcgatgtg 8460 
cgcgttggcc accgcctctt gcaggaccgc cttctgcgcc tgcagattcg gcgccgtgat 8520 
gccattgctc cgtccgtcct gattgattgc cgagccgcgg atgactgcac ggatggcatc 8580 
gccatcggcc agcgcatcgg agagccgctt cagcagcacg atgccgcagc cctcgccgcg 8640 
cacataaccg tcggctgcgg cgtcgaacgt cttgcagcgt ccgtcgggcg ccaacatgcg 8700 
agccttcgac aaagcgatca tgccctcggg agtcaggatc aagttcactc cgccggcgaa 8760 
tgccgcatcg cattcgcgcc ggcgcaggct ttggcaagcc agatggacgg cgacgagcgc 8820 
ggaggagcag gccgtatcga ccgccatgct cggaccgcgc aggtcgagca gataggagat 8880 
gcgattggcc aacatgctat gcgccacgcc ggaacccgac caagctccga tgcgggcagg 8940 
gtcggcgtac tgaaacagtc cgaagtcctg ggcgcaggag ccggcaaaga cgccggtcgc 9000 
gctgcccgcc agagggccgg gagagatgcc ggcgtcctct gccgcttccc agcacacttc 9060 
cagcagcagc cgctgctgcg gatccatgtt cagagcttcg cggggggaga tgccgaagaa 9120 
ttccgcatcg aaaccgtcaa tgcgttcgag gaaggcggca tatcgcgcat acgccttgcc 9180 
cggagcatcg ggatcggagg agtagtactg gtccgagttc cagcggtctg gcggcacctc 9240 
ggtgacaccg tcgacaccgt tcttcaacag cgtccagaag gcgtccggat tcttcgcgcc 9300 
gcccggaaaa cgacacgcca tgccgacgat ggcgatgggt tcggcgtgaa ccaggtcgaa 9360 
gcctgcgatg ttttgccgca tgttccgcgc caatagcgcg agtttgaccg acgacatggg 9420 
cgcaattttt tccctcacga ccttgctcct cggagcgcag ccacggctgc ttcttccgac 9480 
atgtcgtcca acccgctgag tgcagttttc atggcgcggc tgtctccttc cgcagcagcc 9540 
gcggcctgcg cttcgaccag cggcagtccc atttgcgacg ccaggtgcgg ggcaagaccg 9600 
gccagcgtgg gatgacccca aatcagggtc gcggggagcg tgagacccag tgtgagttcg 9660 
agacggttgc gaaactccag ggccatgagg gaatcgaagc cgagttcctt cagcgggcgc 9720 
aggggatcga tagtttgaga gtcgatgcgc agcacgcgcg ccagctgctg ctgtagatgt 9780 
tcttcgagca atgtcctgcg ggtctgaggc tcggccgatt gcagccgcgc gcgcaacgcg 9840 
tttggcgcat cggcttcgct cgccgcgtcg tcatgcaaaa gctcgaacag tgcagactgc 9900 
gccgccttgg gatagaactg ccgccactgg cggacattga tgggcatcgc ggcgacgtgg 9950 
caagccgagc tgttcagcag ctgttccaga atagcgaggc cgtgttgcgg cgtcaggttt 10020 
tccatgccgc gcaaagccag ccgcgatccg cgattgtcct gcgcggcagc cagcccgacc 10080 



wo 01/40497 



PCTAFROO/03311 



68 



tccgaccacg caccccaacc gatgctcagc gccggcaggc cttgggcctt ccggtagtag 10140 
gccagcgcgt caagaaaggc gttcgcggcc gcgtagtttc cctgggcggg cgcgcccagc 10200 
agtcctgcag cggaggagaa gagcacgaaa tgatcgagcg ggcagtcgcg ggtgagcaag 10260 
tgcaggttcc aggcaccgtc gattttcgcg gccatcacgt tgcggaaatg cgcttccgtc 10320 
tggttcagta gcagcgcatc gtcgagaacg gctgcggcat gaatcacgcc gcgcaatcga 10380 
tcgatggaag agatcacgcg ctcgagttca tcgcgctgag aaacatcggc ctgcaccgtc 10440 
cggacatctg cgtccatgac ggcgatggct tgctggacct cgggtgaagg cgcgcggcgg 10500 
ctcagcagca ccagccgccg ggcgccgcgt ccgatcatcc agcgtgcgac ggtaagaccg 10560 
agcccgccaa gtccgccggt aatcaagtag gttccctcgc tatcgaacgc cgagcgtagg 10620 
ggtgcgatgg gcgcattggc gcaatctcgc atcgccatga cgattttgcc gatgtgccgc 10680 
gcctgcgcca tggtgcgaaa cgcctccacc gattcggtga tggtcgtcac tcgcgtttcc 10740 
aggggccgcc aggtttccga ttcgaatttt gcgaccatct cctgcagcag ctcccgggtc 10800 
aatgccgggc gcttcaggga catgccgagc aaatcgacca gcgtgtacga gaggttcttc 10860 
aggaacgggc gaagccccag cttgcggccg gcatagtaat cgcgcttgcc gatctcgatg 10920 
aaccgtccat gatcgcgcag cagatcgaag ctcgcctcca gcagatcgcc ggaaagcgaa 10980 
ttcaggacga cgtctactcc ttcttgattc gtccaattgc ggatgtcgtc cacgaaagcc 11040 
atcgagcgcg aatccgaaac atgcgcgatg cccagcgagc gcagatacgc tcgtttttcc 11100 
ggactcccgg cagtagcgaa gatctccgcg cccgcacgct gtgcgatctg gattgccgcc 11160 
aatcccacac cgccggtggc agcgtgaatc aggactcgtt cgccgggcgc cagccgcgcc 11220 
gctcgcgaga gcgcgtaatc ggcggtgaga aacgcgatag gcagggcggc ggcctgttcg 11280 
gcgggaatgt tggccggctt caaggcaacg cggaaggcgg gcgtggtgac gaagcgaccg 11340 
aaactgcaag gcgcaagggc cacgacttca tctccgatgc gaaagtcggt gacgcctttc 11400 
cccatggcca cgatacggcc cgagcattcg ccgcccaggc gcgggctgcc ggcaatcgcg 11460 
ccgggcgcat cgtcgggcat aacgccgagg gcgagcagaa cgtcgaggaa gttcaggccc 11520 
gcggcgcaga cttcaatctc cacttcaccg gcttgcgggg ggcggcgcga tgtggcccgc 11580 
aagcgcagcc ggtcgaggac tccgggggca tcgatctcga gccggaacgg ccgatcgccg 11640 
gccttgaaca tggcgggttg catatccgct tcgtgccgag ccacgcgcgc gacgtaacgc 11700 
gcgccgccgc gaaaggcgat ttgattctcg ccgttgttcg tcagcagttc gtgcaggagt 11760 
tcctcttcgc cgccggcggg atcgagatcg atcagcgtgc agttcagttc cggatgttcg 11820 
taatgcacgg tccggcccaa accccagaaa ggcgcctgag cgataccggc ttgcaggatc 11880 
tgtccatcga ccggctgcgc gccgcgcgtg accagccata ggcgcggtgc ttgacgccag 11940 
ggcgtgcgcc ccagggtctg gaggagatgc agaatgcggt cgcatgaggg ttcgtgctcg 12000 
agcaaaaaca cgatttcctc gagcggcggc tggagttcat cgagcttttc cggcgaggtc 12060 
tgcgtcacgc ggttgccggt agcgcgcagc catgcggtga gcgcgctatc cacagcgccg 12120 
acaatgagcc atgaccgcgc cgctcgcgcc gccggcggct ctgcagcggc gtgcggctga 12180 
gcgacccagc gcagttcgtg caaccagccg cgcatgtcga tgcgctccga cgcatccagg 12240 
cgctgcagcc gcagaccctc gatgcgggcg accagttgtc cctctccgtc cagcagcgac 12300 
agatcggcga taggtccttc cagccgcgca tgcgtccaca ccacggaacg tgcgggatgc 12360 
agccagcgca tccggtcgat gccggcgggc agccaggttc caccggcggg accaaacgcc 12420 
gcggcgatga tctgcagaca tgcatcgagg aacgccggcg cagtggaacg cgtttccgag 12480 
ctacgcagac gcccgatcgc ctcacctgga caactccaga tctgctcgag cgcgcggaaa 12540 
gccggaccat actcgacgcc gtgctccgcc atctgacgcc acagctccgc cgccggcacc 12600 
actgtggggc agcgggcctg caccgtctcc gcagaatccg gcgggacggt cgatgcatcc 12660 
gcaggcgtct gacgaatgtc cccggaagca tgcaggaccc atgtcgatgc ctgccggctg 12720 
gaaatccgaa acgacgccat cccgggtcta tcgaccgcga tggccagctg caacgtcatg 12780 
ctgccgtcgc gcggcacaat gagcatctgt gtgaaagtca catgctccag cacgcacgga 12840 
ctttcaccga aggtctcgga agttccggcc agagccatat cgagatacgc agtagccggc 12900 
aagacgactt cgccctgcac gcgatggtct gccagccaag gcacggaagc gagactgagt 12960 
tccgtctccc agaagaaagt gccgggttgc gtcgaggctt cgacgcgttt tcccaacagc 13020 
ggattgccca acgtgatcgc gtgtcgcgcg ggggaagcgt cgagccagaa acgacgacgc 13080 
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tgccagggat accggggcag gcgcacgcaa ttgccggaag ggtacacggt ccgccatgcg 13140 
acagtgtgcc cagcctcata gagggcgccc agcgacgtga gcatggaacc gcgttcgtcc 13200 
tggtcgcggc gcagagacgg aaccagcgcc gcattgccgc. cgatggcggg cagcaggatg 13260 
ggatgagggc tgatctcgag aaagacatcg tgcccgctgt cggcaagatg gcggatgccc 13320 
tgccagaaca gaaccggcga tcgcagattg cgagcccagt acgtgctgtc gaggctggtg 13380 
gtctccagcg tcgcgccggt caccgtggag taaaaaggta tggtcgcggg ccgcggttga 13440 
atcccgtcga gcgactgcag gagttcgtcg cacaatgggt ccacttgcgg gctatgcgcg 13500 
gcgaagtcca ctttcaccgg ccggcaagac acgcctcgcc gctccagcgt cgcgacgacc 13560 
tcggccaggg cttcgacttc accggagatg acggtggagt tgggtccgtt cgacaccgcg 13620 
ggcgatagtc gttccgtgta agtcgacagc acggcctcac attccgcgag cggcagctcc 13680 
accatcgcca tcccgcccag gccgctgatc cggctcaaca gccggctgcg gctgcaaatg 13740 
atccgcgccg catcctgcag cgtcagcgca cccgcgacat gagcggcggc gacctctccc 13800 
atgctgtgcc cgatgacggc atccggctcg attccccagg aacgccacaa tgcggcgatg 13860 
gcgacctgca gcgcgaagag cgcaggctga atgacctcga cgcggtcgag cttcgccagt 13920 
tcttctttca gcgaccagtc cacataaggc cgcatggcgg cctcgcagcg ttccaacgcc 13980 
tcgcgaataa cgggttcgcg gtccatccag ctgcgcccca ttccgatcca ttgcgatccc 14040 
tgtcccgaga agacgaatac cgtcttccgt cgctgggaag ggatcgtgat cccctggagc 14100 
tgcgccgcca gttcttcagc cgttctgccg gaaacagcga gccggcatcg gtgatgcgtg 14160 
cggcggactg cggccgtgta gcaaagatca cgcaggctcg gtgcgtgcga cgctgtcagc 14220 
aattccccgt atgcccgcgc cacccgacgc agttcgtccg caccatgcgc ggacagcgga 14280 
agcacataca tcgcgtctgc aatgcccgta gttgccgcag tgcctgcagt ccctgcaatg 14340 
tcgggagtgt ctgcagtgtc gggagtgtct gcagtgtcgg gagtgcctgc aatgtcggga 14400 
gtgcccccag tgtccccctc cgcgaggggg acagccgccc gcgcagcggc ggcggggggt 14460 
cgggaatgga acccgctcgc agcttcgcct ctaccagtcg gcgccgcttc ttcaagaacg 14520 
acatgcgcgt tcgtgccgga ccaaccaaac gcgctgacgc ccgcaaacct tcgtctcgaa 14580 
cccgcgggcc acggccggac ttccttcaca atgtcgagcg acgttccctc caaccggata 14640 
ttcgggttca gctgtctcac gtgtaagctc ggcggtatcg tctcgtgact caatgcgagc 14700 
accgctttaa tcaatcccgc tatgcctgcc gctccctcca ggtggccgat gttcgatttc 14760 
agggacccga ccgcgcacac atcgccgaca ggtcgcggga ggccgacggt ttccgccagc 14820 
gcctcgatct cgatgggatc gccgagcgga gtccccgtgc catgggcttc gatgtaaccg 14880 
atctgctgcg ccgcgacgcc cgcattggcc aatgccgacc ggatgacgac ctgctgagac 14940 
acgacattgg gagcggtgag cccggccgag cggccatcct gattgaccgc ggagccgcgc 15000 
accacggccc acacccggtc tccggccgcg agtgcatcgg acaggcgctt cagcaccacc 15060 
acgccgcagc cttctccgaa cacgatgccg tccgccgccg cgtcgaaggc gcggcagcga 15120 
ccgctgggcg aggcggttcc catcttcgag gtggcgtaca taaactccgg cgagaagcgc 15180 
agattcactc cgccggccac ggccagcgta cactcgccgc tgcgcaggct ctggcacgcc 15240 
agatgaaccg ccgccagcga agacgagcag gccgtgtcga gcgcgatgct gggtccttgc 15300 
aagttcagca aataggaaag tcggccggcg atcacgctat gcgccgtgcc ggtggcggta 15360 
tacggatcga tgcgcgcgcc atcggcggtc tgcatccaga aatagtcgct gctttggctg 15420 
tggatcccga cgaagacgcc cgtgcggctg ccggagagcc cttccatcgt ctgccccgca 15480 
tcctccagtg cctcccacgc cacttccaac agcagccgct gctgcggatc aatgctgacg 15540 
gcctcgcgtg gcgaaatgcc gaaaaaatcg ttgtcgaaac catcgatgga atcgagaaat 15600 
ccggcttgaa tcttcaccgg cgtggcgggg ttcaacgatt tcaggatgcg ccggaccgac 15660 
tcctcgtccc atcgtccagg cggtacctca cgaatagcat cgactccact gcgcaacatc 15720 
tgccagaact catcgggccc atcgccgccc ggaaaccggc agcccagacc cacgatcgcg 15780 
atgggttcgc gcgcgtcgcg ttcggccgca tcgagacgtc gctgcatgtg ctccagcgtc 15840 
aggtacgcct gctgcaacgg cgtaaggttg gggaatcgct cggatatcga actcactcgg 15900 
aggctcctga aaaatgagcg aacttctgtt tcaacaaagc ttcgatttct ttgtccccca 15960 
acccggcgat ctggtttgcg acggcgtcga gatcgtctgc agcggcggga ctccggtcct 16020 
cgcccgcggc ggtgccaacg gtagcaaggg tagcaacggc agcaacggtc gaaggttcag 16080 
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cattgccggc catgctttcc agcggcaggc cgagcttgtc ggcgagatgc tgcgccaggg 16140 
cggagaatgt cgggtaacgc cagatcaggg tggcagaaag cttgacgcgc agcccggctt 16200 
ccagacggtt gcgaaactcg agggccatca acgaatcgaa tccgagatca cccagcgtcg 16260 
ctctgccgtc gagtttcgct ggatcgaagc gcagcacgtg tccggcttcg tgcatcagca 16320 
gcgtttccag ccgcgcgcgg cgctgccgcc cggctggaac tgccaggagc tcgctgcgca 16380 
tgtcggccgc cggtttggtg tccgcggccg cgggtgcgat gccggccagc agggacatcg 16440 
atgcggccga cggatagtaa cggagccact gcgcgatatc gaagttcatg acagcgacgt 16500 
gcggccgaat ctgcgtcaat gctttgtaga gcgcgcgcaa tccctgttgc ggttgaataa 16560 
ccgagatgcc gcgcgcggcc agacggtctc cgcggttcgc ctgtgcggcc aaaccaacct 16620 
gtgtccacgg tccccacgcg atgctgacgg cgggaagacc ctgggcgcgg cgcagatgag 16680 
ccagcgcgtc gagaaatgaa ttgccggcgg cgtagttgcc ctggccggga gatcccactg 16740 
tcgcgctggc ggaagagaag agaacaaaat gatccagcgg ccggccggcg gtgagttcgt 16800 
gcaggttcca cgcgccggct actttcggag ccatggcggc ttcgaagcgt tcggtcgtga 16860 
gattgagcag catgccgtcg gccagcgtgc ctgccagatg gaacacgccc cgcaacggcg 16920 
gcatgtcgcg atcgatgatc gcgagcgcat ccgatagctg ctgccggtcc gccacgtccg 16980 
catggatgat cttgacgttg acaccttcca gttgtggccg aggacgctcg ctgcgtccca 17040 
gcagaacgag atggcgcgct ccggcggcgg cgagccatcc cgccacctgc agtccgagtc 17100 
cgccgagccc gcccgtgatc agataggttg cgtcggcacg gaacgccaca tcgggtgcgg 17160 
atgggatctt gtgaagactg aggcgcggcg cccataccgt gccttgccgg atcgcaactt 17220 
gatcctctgc gatattcgac agcatcagcg tcgcgagatg cccgcagtcg ttgctgtgcg 17280 
catcgagatc gacgagcgtg cagcgcagct cgggatgctc ataggcaatc gtccgcccaa 17340 
ttccgtgcag ccaggcttgt cgaatatcaa tatctttgtc ggagttgaga accgcggcag 17400 
atccgcgcgt cagcagccac aggcgcggcg gctcaggcca gcccgcttgc acgatgctgc 17460 
gcaatacgga aagcaggtcg tcgatgcgcg gcgagggaca gtacacaatt tgacggcacg 17520 
gcggacccga gcacgtatcg gccgtgcggc aggtttggcc gcgcttttgc agagtctcgg 17580 
caatcgccgg ctcgccgatg acgagccaag gtccgccagc attgccggca ttggcatcgc 17640 
cgcggcgaac cgacgcggtc cattgcaccg tccaggtggg aatctccgat tcgccgagct 17700 
ggccgctatg ggcgactctc gactgcagcc ccaccaattc cgccaccacg ctgccggtgc 17760 
cggtgacgag acggacatcc accgtggaat ccggccgcaa gaccgcgtat ccccagaccg 17820 
ggccagtggg cacttcagcg agcgagaatc ggtccagacc taccggcaca tgcacatctt 17880 
tcaaatcgtc gtgatggacg agggccgcgg gcaactgcag acagcagtcg atcgtctgca 17940 
tttccgtcag cggaatgtcc acgcgacaaa gcacctcacc gttgccgcgc cagatggggc 18000 
cgatggttcg gaaggtggga ccgaagtgat agccgcgatc ccacagtcgc gaatagaagg 18060 
catcggctgt gagctccgcc gtgcagcggg cgcgaatcgc atccagatcg atggatgccg 18120 
tggaatcgcc cgcctgcagc atgccttcgc tgtgcagctt ccaggaatcc tcgcggctgt 18180 
agatgcggaa ggaagctccg ccgccctctt catgacggag taccagttga acctgcctgg 18240 
cagcatcgtt ttccggcagc gtcagcgcgc ccgtcaatga cacgtgttcg acatggtgag 18300 
gcccggcgcc gagaccttgg cgcgcagcgg cgagcgccat tgccaggtgc cacgctcccg 18360 
gagtcacgat cacatcgtgc agccggtgat ccgcgaaatc tttcgcctcc acagtggact 18420 
cgaactgcat ctccggcagc ggcgacggga tccgccggcc aggcaaagcc tgagactcga 18480 
cctgcggcgg acggatatcg atccaataac gctcacgctg ccagggatag ttgggcagcc 18540 
ggcgagtttg gccgccgttg ggataaatac gagaccagtc cggagtgact ccgttagtca 1860O 
gcagcgctcc cagcgtccgg cgcagtgcga ggtttccgtc ttcatcgcgc cgcaacgagg 18660 
cagcggcaat cgctgcccga tctccgagcg tttcctggat cggctggacc aacaacgggt 18720 
ggggactcag ttccagaaac acatcatgac cacccgccgc ggctgcggcg acggccgtcg 18780 
acagcatcac gggttggcga agattacgag cccagtacgc agaaaccagc tcttcaccgc 18840 
taatcgctgc gccggtgacg gtggagtaca tgccaagggc ggccggccgc ggctgaagcg 18900 
ctcccaccac gcccggcaac gccgcgcaca cggagtccat cagatggctg tgcgaggcaa 18960 
tgtccacttt cacgcgacgg cagaagacgt ctttcgcctc cagttcccgc agcagttcgc 19020 
ccagagctgc gctgtcgccc gacaggacgg tgctgcgcgg gctgttgctg gcggcaatcg 19080 
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agacccgatc cgagcgcccg gcgatggcag cgatggcctc gtccagcgct aattccacga 19140 
cagccatttc tccctggccg cgtactccgg cgagcatccg gctgcgcagg caaatcaccc 19200 
gagcggcttc atcgagagtc agcgcacctg caatgtgcgc tgccgcgact tcgcccatgc 19260 
tgtggccgat cacggcgtcc ggctcgattc cccaatggcg ccacagtccg gccaaggcga 19320 
ccccgactgc gaacagggcc ggttgaatca cgtcgatgcg gtcgagcggc ccctgcaact 19380 
cttgcgtcag cgaccagtcg acgtaaggct gcatggcgcg gccgcactct tcgatggcgg 19440 
cacggaacac cggttcagaa gccatcaggt cgcggcccat gccgggccac tgcgatcctt 19500 
gtcccggcaa aacgaaaacg acttttcgct tctggccgcg cggcacaaaa cctgtggcgg 19560 
tatcgcggtt cgggttgccc gccagaaaac tgtccagccc ggccatcaag tcctgcgcgt 19620 
tcgtcccggt gaatgccgcg cggtgttcgt atgaagtgcg gcgagcgcac gccgtgtagc 19680 
aggtgtcggc ggggttgtcg ttcaccacgt cgcggtatgc gcgcgccaga tcacgcagcg 19740 
cctccggact gcgcgccgat agcggaagca ggtacggtgc gggcgtactg gacgcggcct 19800 
gttgcggcgc ctgctcgatg agcacgtgcg cattcgtacc gctcaagccg aacgagttga 19860 
tgccggcgac gcgccgcccg ccgggtgcaa ccggccaggg ggtgagccgt gccgggattt 19920 
cgaggggaag cgtgttccaa tcgatgtgcg ggctgggcgt ggtcagattc agatggggcg 19980 
gaatggcttc gttctgcagc atcagcgcca ccttgatcag tgcggccacg cccgctgccg 20040 
cctcgaggtg gccgaagttg gtcttcaccg acccgagctt cagcttgttg ccgttggtgc 20100 
gccccgctcc cagcgcggcc gcaagggctc cggcttcgat gggatcgccc agcggcgtgc 20160 
cggttccgtg cgcctcgaca tagctcacat ccagcgtctg caagcgcgcg tctcccacag 20220 
cctggcggat cacggcttcc tgtgcgggcc cgttcggcgc cgtcagtcca ttgctgcgtc 20280 
cgtcctggtt gattgccgtg ccgcgaatca ccgccatcac cggatcgcga tcgcgcagcg 20340 
cgtcggagag tcgcttcagc acaaccacac cgcagccctc accgcggacg tagccgtctg 20400 
ctgcggcatc gaatgcctta cagcgaccgt cggctgccat cgccttcagc ttgcagaagt 20460 
agatcgtccg atccggcgag agaatcagat tgacgccgcc cgccagcgcg aggtcgcttt 20520 
cacctgagcg caggctctga caggcaaggt gcaccgcgac cagcgatgac gagcatgccg 20580 
tgtcgatcgc catgttcggg ccctgcagcc cgaggatgta cgagagacgc ccggcggcaa 20640 
cgctggccgt attgcccgtg ccggtgtacg cgtcgatatg cgcatccccg ccgcgcattt 20700 
gcaggttgta ataatcgttg gaaaagatcc ccatgaagac gccggtccgg ctccccgcca 20760 
gccggtcggg tggaagcccg gcgttctcga tcgcctccca ggtgacttcc agaagcagcc 20820 
gctgctgtgg atccaggctg atcgcctcgc gcggagcgat gccgaagaac cgggcgtcaa 20880 
aacggtcaac ctgatcgatg aagccgccgt accgcgtgta cattcggccc gtcgcgccgg 20940 
gatccggatc gtagtaggca tcgatgtccc agcggtcggg tggaacttca cgtaccgcgc 21000 
tgcggccctc gcgcagcaac gaccaatagg catcgagatt ggatgcgccg gggaagcggc 21060 
agcccgcgcc gatgagggcg atgggctcgc tgcgcgcgct ctccagctgg tcgatgcgtt 21120 
tctgcacctt gtcgagcgca atcacggcgc ggcgaagctt gctgagatcg tctgacccgc 21180 
tcatgtttat tgcgtctcca accactggtc gacctgcgcc agccgcgaat cgagcagcgc 21240 
ttccagttct tcgcgggcga ggttctcaaa ctccggcgct tccaccggtg atgcttcggg 21300 
tggaaatacc gcatggagca cgtaactgac gatcgcatcg agcgacggat agtcgaacag 21360 
cagactcgcg ggcaaaggct gccccagtga ttgggagagc gagttgcgaa gttctatggc 21420 
cattagcgaa tcgagtccca gttcacccaa aggctgctgt ggatcgagcg gtgtggaagt 21480 
cgcgatgccg acaaagcgcg ccagtgactc cctgatgtgc gcaatgagga tggcttcgcg 21540 
ctgccggggt gtggcttcgt tcaagcgggt gcgcagttga ggtgaaggca gcgcggcggg 21600 
acgcagcaac tcgccggtaa tcgagcccgc cggtagcgcg gcaatctgaa tggggcattc 21660 
atgcaggacg gcctcgagaa tgtgtagacc ctcgtccacg gagaggctcg ccacgccggc 21720 
catcgactgg ctggtgcgcg cggccattcc ggctcccgac cagcgccccc agttaatgct 21780 
ggtcgccggc aaacccagtc cgcgccggtg atgcgccagc gcatcgagaa cggcgttggc 21840 
cgcggcgtag cctgcctgcc cggcaggacc taagagcgag gatgccgatg aaaagagcac 21900 
gaagaagtcg agcggcagat cgcgggtgtg atgatggagg tgtacagcgc cttccgcctt 21960 
cggcgccatg acgcttgcga tccgcgtcca gtcctgattc agcagtacgc cgtcgtccag 22020 
cacacccgcg gcatggataa cgccgcgcag cggtgacgtt tcggtgtgga tgcggcgaat 22080 
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gagatccgcg acctcttctt cccggctgac gtcgaccgtc tctgccgtcg caccaatctg 22140 
ttgcagcacg cgctgctgct cctcgtttgg aggccggcgc ccggccagca cgacgcgagt 22200 
ggcgccgtgc tccaccatcc atttcgcgac tgtaagtccc agggctccga gcccgccggt 22260 
gatcaaataa gtcgcgcccg aaaccagacg gactgccgct cgcgcgctgg gtcggcgggt 22320 
cagtcgcggc acgtagcgcc ggttgcttct ccacgccgac tgatcttcgc cgtcgaaatc 22380 
acgcatctgc gcggccgcgc cggccgccga agcatgcgca tcgtcgggat ccagatcgat 22440 
gagcccgccc cacagatccg ggtgctcgcg cgcgatcacc cggccgaagc cccagagcgc 22500 
ggcctgcatg ggattgtgca ccgcactggt cgcctgcgcg ccggccgtta ccagccatag 22560 
ccgcggaccg gacttcaggg acttcaccag ggccagagtg ctgcggcagc cgagctcata 22620 
atcatcgaga ctgtacaggt tgacgatccc gcgccagtca cgctcaccga ctagggacat 22680 
gtactcgccg gctggcggca cggtaacgca catctcgccc tgagctgtga gcgcatctgc 227.40 
cagagcgcgg gccgcgccgc cactgtcggc caggatcagc catgccccag gctgtagcgt 22800 
tcgcgaaggc tggcggagcg gttcgggccg ccactcgacc tcatacaatt cgggcttccg 22860 
ttccgagcgc tgcgcccatg cgcgagtgac gcgccggaaa ctcacgccct gaagttcccc 22920 
gagaacgcag ccctccgagt ccagcaactg cgcctcgccg gtaaagccgt ccggcgaatg 22980 
ccggagaatt tgcgcggccc cccatacggc gccctccagg ctgccgtaaa aacaaacgcg 23040 
abcgataccg agcggagcga atatcggatg ttcggcgcca tccgcaagcg cgggactcgc 23100 
cgcggcgcta agcaattgca ggccggcttc cgccaattca caacggggat tgagcggcgt 23160 
tgcggaatca atcgcggcca gcgcttcctg ttcaccgaaa tgaatgcgct gtatgcggcg 23220 
gtagctcggc cccagttcta tctcgaggtg gcgcagcagc gaatagtacg tgtctccatc 23280 
caccgcaggc cggcgttcat cgaccagtcg gggcacggga gcgacaccag cgtgggcggc 23340 
aatattgccg gcagcatgta agttccacga gccgtcggac aagctgagta tgcggaacga 23400 
ggcatgccgg tcatcgctct gtgaaagcac gagctgaaca gccgtgtcgc gctccgctga 23460 
aaggatcaga gggtgcgcga agttcacgtt ttccagcgtg tgccggccgg cgccaaacac 23520 
ctccgccgac gcctcgagcg ccatggccag gaagtacacg gccggggcca ccaccgaacc 23580 
gtaatatcgg tggtctgaga gtagaggcga agccgtcgat agtttcgact cgaagataac 23640 
gtctgccacc ggtagcgaca gccggcaccc gacgagacca ctcgcaaccg ctacaggttc 23700 
cggtctggaa ctccgctcga tccaatggcg gcgtctctcg aaaggatagg ccggcagggc 23760 
gacacgcctt cgcgaatacg gacggtcgaa ctcctgccaa tcgatgtcga acccaccctg 23820 
atatagcgtc gccacactgc tgagaatcgt ctcccactca tcgcggcctt tacgcagcga 23880 
cggcagccac tgcttggcgt cgtcgggcag gcacttttgg cccatgccga gtagaaccgg 23940 
cttaggaccg atctcgagaa acacgtcgca gccttcgtcc ttgagcgttt ggataccgtc 24000 
ggcgaaacgg acagggtttc gagcgtgatc tcgccagtac agcggattcg ccagctgtcc 24060 
ctcgccggcc agtttgcccg tgaggttcga aaccaagccg atcgaaggat tgcgccacgc 24120 
gatcgccgcc gcccggcgtt gcaggtccgc cagaatcgga tccatgctcg agctgtgaaa 24180 
ggcgcgcgca acggccagca tctgcgtttt gatgccctcc gcacgtagag ttgccagcgc 24240 
gctctcaata tcctgcggcg cacccgaaat cacgacctca gcgggtccgt tgatggccgc 24300 
aatggagacg cgcgaggtga tcgctgcggc acagcgctgc tcgccggcgc ■ tgaccgcagc 24360 
catcgcacct tccggcaggt tctgcatgag ccggccgcgt tcggcaacta agccgagcgc 24420 
atccggcagg ctgacggcgc cggcaataca cgccgccgcg tattcgccga cgctgtgtcc 24480 
catcaccagg tcgggcgtca caccccagga cttccacaac tgcgccaagg cccacCgcaa 24540 
agcaaacagc gcgggctgcg cgccggcggt cgcgtcgagc aacgcgtcat cggccaacag 24600 
cgccggcaga tcgagccgtc cattcagcag agctgcgcat tcatccatgg cggcgcgaaa 24660 
caccggctgc gactcgtaga actggcggcc catgcccgcg tattgcgcac cttgcccggt 24720 
gaaaagaaac gcaatcttgg ggcgcgtctg ggcgatgcga acccgtcgtg cctccgtcag 24780 
tcgttggcga gcctcgtcgc tcgaccgggc cacaatgcag atacggtgcg ggaagtgcac 24840 
gcgccctgca ttggccgtga atgcgacatc gccgaacgac aaaccgggct ggttgtccat 24900 
atggccgcga tacgagcgca ccagttcttc gagggccgcg tctgtattgg cggacaggca 24960 
aagcacatgt gcggatcgtt cgggcgcagc tgcggccggc gtcaccggcg gcgcttgctc 25020 
cagaatcacg tgagcgttgg tgccgccgat cccgaacgaa ctgactgccg ctcgtctcgg 25080 
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ggtctttccg gcgggccagt cgagcagccg cgtactcaca cgaaacggag tgtttgcgaa 25140 
atcaattcgc ggattcggac gctggaaatt caggctggga ggaatctggc cgcgatggac 25200 
ggcaagcacc gtcttgatca gcccggccac accggccgcg acgtctagat gaccgatgtt 25260 
ggtcttgacg gatccgatat acacatcgcc gcttccgttt ttcggaaagt tggcagcgat 25320 
ggcggcgatc tccaccggat cgccgagcgg cgtggctgtt ccgtgggcct cgatgtagcc 25380 
gatggactcc ggcttcacgc ccgccatctc ttgagtgcgc cgaatcaatc gcgtctgacc 25440 
gtccacacct ggagcggtaa accccatgcg ctcggcgcca tcattattaa tagccgctcc 25500 
gcgaatgacg gcgtagatcg tgtcgccatc ggccagagcg cggctcaagc gcttgaggac 25560 
gaccacaccc gcgccgttgc ccggcaccgt gccttgagcg gactcatcga aggcgcggca 25620 
gcgcccgtcg ggcgacagga tcatgcccgg ctggtgcagg taccccacgg actgcggaac 25680 
attgatggca actcccccgg ccaaggcaat gtccgaggcg ccgcgctgca agctctcgca 25740 
tgccatcacc accgacacca gcgaggtgga gcacgccgtc tgaaccgtca ggctgggccc 25800 
gcggaggttc agcttgtaag agacacgcgt ggccaggaaa tccttgtcgt tggccgtcag 25860 
cagctggtac gcggaggggc gtgagaaatc gaacggctcc gcggtggcga ggttgttcag 25920 
caggtaggta ttgacgccgc atcccgcgaa aacgccgatc gaacccttat agcttcgcgc 25980 
cgcatatccc gcgttctcca tcgcttccca cgcgcactcg agaaacacgc gatgctgcgg 26040 
gtccatgatc tccgcttcgc gcggactgta gccgaagaac gcggcatcga aaaactcgat 26100 
gccgtccagc agacccttgg ccggcacgta gctcgggtcc tggaagacct ccgggctgat 26160 
gccgcccgcc agcagatctt ccggcgaaag cctggcgatg gaatccacac cgtcgcgcag 26220 
attgcgccag aactcctcca cattgcgcgc ccccgggaac cggccggcca tcccgataac 26280 
tgcgatccga tcttctgcga ccgcagccgc aggttccgca gcggcgggtt cggatttttc 26340 
tgccaggccg gcaagcgact cgatcgtcgt atgccggaac agatcgacga cggagagcgt 26400 
caaccccagg cgctcctcga gcagtccgcg cacccgtgtg agcattagcg agtgcccgcc 26460 
gacatcaaag aagttctgcc gatagtcgac gtgctccacg cgcagaactt cacgccagat 26520 
ggacgcaatc gtctccacca catcgccgcg catcggctcg cgagcagcaa ccggcgttgt 26580 
gggcaaaccg ggaagcgcgt tcgcgtcgat tttgccgttg ggcgtcagcg gaagggagga 26640 
caggctgaca aacgccgagg ggatcatgta atcgggaagg cgcgttgcca gccacgaccg 26700 
caaatcgctc tgcagatcgc gcacgtcgcc cgttgccgga acgagatagg cgatcagccg 26760 
atcgtccttc acgaccgtaa tcgcctgctt cacggcaatg tgcgtctcga tcgcggcctc 26820 
aatctcggcc ggttcgatgc gaaacccgcg cagcttgatc tggcgatcga ctcgtcccag 26880 
gcactcgact gcgccgtcgg aacggtagcg agccagatcg ccggtagagt aaatgcgtcc 26940 
tcgatcacgc cactcgcgga atttctcacg cgtgagctcg gggttgcgat gatagccccg 27000 
cgccagtccc gctcctccga tgtacagctc tcccggaact ccggggggaa ccggctccat 27060 
gcgcgaatcc aggatgtata actgcgtgtt gtcgatggga tggccgatcg gcacgatgct 27120 
atcggaggca cccagtcttt gtgtcttgtg cacggccgac catatggtgg tctccgtcgg 27180 
tccgtaaaga ttccacagct ctacgccact atcgagaatg cggcgcgcca gttccggcgg 27240 
cagagcttca ccgccgcaga aaacacggaa gcctttaccc ggcttccagc ccgaatccag 27300 
caattgccgc caaccgctcg gggtcgcctg catgaccgta gcgcccgact tatccagcag 27360 
ggtggtgagc cgctcgccgt caaccacgat ctcgcgggtg gcgacgatga cgcgggcgcc 27420 
ggtgatcaac ggcagccaga tctccagtcc ggcaatatcg aatgacacgg tggtgacggc 27480 
gaccagccca tcggcggctg tcagacccgg ctcgcgctgc atggagcgca gcagattgac 27540 
tagcgacgag tggcggatct ccacgccctt cggtcgcccc gtcgatccgg aggtatatat 27600 
gatgtaggcg agatcgtcgg gcttgctgcc gctgacgaga ttcgcagctt ctggttcgac 27660 
ggcgaccgcc atcatcgcca tcatcgccat catctcagcc accgcctcct gcgtgaggac 27720 
cgcgtgcggt tgcacttcat cgagaatccg ggcgagacga tccttggggt gcgcgggatc 27780 
gagaggcagg tacgcgctgc cggacttcag aatcgcaagc agcgcaatca ccatctccag 27840 
cgagcgctcc atcgccagag cgatgatctt tcccgggccc gcgccggatg cgctcagacg 27900 
atgagccagg cggttggccc gcgcattcag ctcggcgtag gtcaactgat ggtcttcgaa 27960 
gacaacggcg acggcgtgcg gagtgcgttc cgcctgagct fccgaccagtt catgcgcaca 28020 
cccgttcgga ccggcatcgc gccgtgtcgc attgtgctgc tcgagcatcc ggcttcggac 28080 
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cgcgggggac aacagcgcag cggttgaaat gcggacgtcg ggatccgtca ccacgctcgc 28140 
cagcagggtt cggtacgcat cgagcaggga ggcgatggtt gccgcatcga acaaatcggt 28200 
gttgtattcg gcggacgcca tcagtccatc gccggatggc tcgagggtca cgccgaggtc 28260 
gagtttggat ccgccgttgt gcatgtactc gcgcgagatg gtgagcccag gcatgacggt 28320 
gatggccggc gcatcgggca gcagcgcgaa ggagacctga aatacaggcg accggctcag 28380 
gtcccgcgga ggatgcagtt cctcaaccag gcgttcgaaa ggaaagtcct gatgagagag 28440 
ggcgctcaaa gcggtgtcgc gggtgcgggc gagaagactg cgaaacgacg gatcgtcgcg 28500 
cagatcgccg cgcaggacga tcatgttggc gaaacaaccg acgagacctt ccgtttctcg 28560 
ttgtgtacgg cccgcgactg gaaccccgat aaggatgtct tcctgcgcgg tatagcgatg 28620 
cagcagcacc tgaaacgccg cgattgccgt catgaacacc gtcgctcctt cacgcaaggc 28680 
aaacgcgtgg agtccatcgg tcaaatcacg gccgagggct gtggtctcca cggcgccccg 28740 
ccaggtctgc tgcgcgggcc gggggcgatc ggtaggaagg tcgaggaaag gcaaggtgcc 28800 
cgacagctgt ttcttccagt actgctgcgc ggtttggttc agcgacgtct gctgatggac 28860 
ggcccagtcg ccatactgaa tcggcagttc catgagcggc gatggccgcc cctgcacgaa 28920 
cgcttcgtac gatcgcgtca ggtcgcggac gaacgtctcg accgaccacg catccgcgat 28980 
gatgtggctc aacgtcagca ggagaatctg ctgcttgtca tcgaggcaga tcagcttggt 29040 
ccgcagaagc gggggttttc gcaggtcgaa cgggatctgg gcatcacgca aggccatttg 29100 
ccgcgcttct gcgattccgt cagcctgaac aaccggaagt tccagtgtca ctcgcgccag 29160 
gaggctctgg cgcgcctctc catccacacc gccaatgcag ctgcgcaggc tctcgtgccg 29220 
ctgcaccacg gcctccagac tccgcaggag gacgcgaata tccagcggac ctcggatatg 29280 
cagcgctatg ggaatgttgt aggcgggaga atccgggtcg agctgatgga gaaaccaaag 29340 
ccgctgctgg gccagcgaca agggtgcggc atcccggttt tcacgccgcg ggatgcgatg 29400 
ttcggggctg ttttcctgca gcagacggtc gagcaattgg cggcgggcga gcgagaggtc 29460 
tatggtattt ggcgacgaat tctgcattac aacccgctgt gttcctagtc ttgggcggcg 29520 
ctcatcatac gctcgatttg aacatctgac atttgggaaa cagcgatcag caaatcggcg 29580 
gctcgccttg cccatcctgg gtctacgccg tcctgaatag cgacggcgaa gcctcgaacc 2 9640 
gtgggggcgt taaacacggt tcgaaagggc acttccacgt ggagcatgtc gcgcacgcgg 29700 
gcgatcatct gcgtgaccag cagcgaatgt cctccagagt cgaagaagtg atcatggacg 2 9760 
ccgatgccat ccatgccgag cacctcgccc caaatgtggg cgagtacctg ttccaccgga 29820 
gtttccggag gcgtgaatgc ttcggcgtgg gctcgccggc tgggctcggg atcgggcagg 29880 
gcgttacggt cgatttttcc gttgggcgtc agcggcattt cgtggagcac gacccacgcg 2 9940 
gtcgggatca tgtagtcggg cagcttctcc ttcagatgag tacgcaactg cggcacaacc 30000 
gtgcgcgtat agacggctcg cagcggatcg ttcgtatacg ggccggccag gcggcgtcgc 30060 
ggacgggaag ccggcggacc ggccgccgca cggcagaagg tcgcgtcgaa gcgtccgtgt 30120 
ggcccatgac tgctccagtc gattgccacg cggtacggca ggtcttcgtc catacgccat 30180 
agatcggcgg gatcgacgcc ggaaggcgac gtctggcgca gccggtcccg caactccccg 30240 
agtgtctctg gagcttcgtc accgttcatc caggtcacaa tggcgctttc ggcggtcaac 30300 
cgtgcgttcg gaatctcggt aaatgcggcc aactccggct gagcgtccgt cagtactctg 30360 
cgtatttcgg ccgcggtctg gcaacgcctg. cgatccgatt ccggctcctc cgcttcccgc 30420 
gatccgatat gcaggatcgc ctggtagcgg aagcgggtca gctcgttatg cgaccggccg 30480 
cgacgcggca ggatttcaat ccggccgatc tccggaatct gttcgcggag agcaaagaag 30540 
aacgcgggat cgaccacgag ttcctcttcc tgcgacgcga gcgaacgcac gcgttgccga 30600 
aactcattcc gggtcaacga cgcgggtgcg cgctgaactt ctaaagaagc gtaaaacgtc 30660 
tccagcagcg ggagactgcg gacatcgccg acaaatacga tgccgcccgg tttgaccaca 30720 
cgcaccgcct cggccagcac gcgccgcaga tacgcttcgc cggggaagta ctggataacg 30780 
gagttcagaa caaccgcatc gcacgagcga ctgtcgatct cgcacgcgtc gtcggccgcc 30840 
tgccggaacg tgcggacatt tgccaggccg gtgcggtccg cgtgagcggc gatgtagtcc 30900 
agcgccttct gcgaaaagtc cgtggcccag tactccgaac agtggggagc gacgcggaag 30960 
agcagcagtc ccgtaccaca gccaatctcg agcacgcgac gcggccgcga ggccaggatg 31020 
cgatcgacgg aatcctgcac ccactcccgc atctcggcag ctggaatcgg ctctccggta 31080 
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acactgcttc tccagccgac gatgttgaac tccggatccg cgttcggcgc attctgttca 31140 
tatgtggtgt cccagacgga ttgccactgc gtcacgtgct cggactcgac tcggtcgtgg 31200 
aatgtgtcgg cggctgccgt cgcgcgatgc ccgtcagcaa gggggacaat gtaggccgcc 31260 
agatacttac cggccgcgtc attttctctg gcggtgacca cagcatgtcg gaccgccggg 31320 
tgactgcgga ccgcggcctc gatctcgccg gtttcgatgc ggaacccgcg tatcttcacc 31380 
tggtggtcga tccggccgag atactcgagc gcgccgtcgc gttggcggcg ggcgagatct 31440 
cccgtgcgat acagccgagt gccatgaggg tcgaacgaat tggcgacgaa cttgtccgcg 31500 
ctgagttccg gacgattcag gtatccacgg gcgagcccgg cgccgccgat gtacagttcg 31560 
cccgcaacac cgatgggtgc gggctgcatc cgatcgtcaa gcacatagag ctgagtgttt 31620 
gcgatggggc ggccaatcga aaccggtccg tcacctgtcg tcacccgttg gatggcggac 31680 
caaattgtcg tttcggtagg tccgtaaaga ttccatagcg ccgcggttcg ttgcaggagc 31740 
cggtcggcaa gatcgcgagg aagggcttca ccgccgcaga gcgccgtcag gcggcggtcg 31800 
ccgggccagc cggatgcgag cagcagacgc caggtggcgg gagttgcctg catcattgtc 31860 
gctttgctgc gcgcgagttc cctcgccagc ctctcaccat cgacggccgt ctcctggttc 31920 
gccaccacga cgcgcgcgcc ggcgctcaag ggcaaaaaga tctcgagcgc ggaaatgtcg 31980 
aacatgaacg tcgtgagggc gagcagcgta tcgcggtcgc tgatgcccgg ctcatgccgc 32040 
atcgacgaaa gaaaattgac gacggcctgg tgtgtgattt gcacgccttt cggccggccg 32100 
gtcgaaccgg aggtgtacag gacataggcg agatcggcgg gagtcgcgag cgggttcgga 32160 
ttggtgtcgg gctgcgtcca tacttccgat tccgtgacat tcagcacaac gaccggcctg 32220 
gtctcttcca gcatcagccg aagacgttgc gccggatatt ccggttccag cggaacgtag 32280 
gccgcgccgg ccttcaggac gcccaacagc cctgcgacgg tttcgagcga ccgcgtgaca 32340 
tggatgccaa ccatttcgcc gggtccagcg ccgcgcgagc ggagatagtg cgcgatccgg 32400 
ttggcgctcc cgttgagttc gcgatatgtc agattctgct caccgaagct caacgcgatg 32460 
gcgtcgggcg tcaactccac ctgagcttcg aacagctcgt gcacgcattg ggacgggaat 32520 
tccgcggcgg tcgcattcca ctcttcgagc agctggatgc gttcccgggt tgtcagcagc 32580 
ggtagatcga caactggaca ggcgggattc tccgcgattc cttccagcag cacggcgaag 32640 
tgcaaggaga gacgttcaat cgtggcagca tcaaaaatgt ccgtgttgta ttgcagaaag 32700 
gcggagaggc ctccatcggt ttcgaccatc atcagatcca ggtcaaaccg gctctgtcgc 32760 
agcggcatcg ccagggactc cagtgtgagg ctgccccagg ccatgcgacc gccggactga 32820 
cccaacatga acggcacgga ttcgggaatg cgatgaggct gctggagcac gaatagaacc 32880 
cgcagtccgg gacccaaccg ctccacgatc cgggcatacg ggtactcctg gtgctcgatc 32940 
gcgccgagaa gcgtttgccg aatccgggcg agcaccgtat tgaaatccgg atcgcctgaa 33000 
agttctcctc gcaggattac gggattcacg aagtatccga cgagatcggc gaattccggt 33060 
tgcgtccgac cgttggtgag ggtgccggtc aggatctctt cttgtgaggt ccaacgggag 33120 
agaagcactt gaaacgccgc catcagcgtc gcatgcagcg tcgcgttctg ccgccgcgcg 33180 
agcgccttca gtttcgcagt cagcgcgggt tcgattcgga acgagtgaga gtttccccgg 33240 
aaactctgca ccggcggact gggacgatcc gacgggagat tcagaaccgg aagctggccg 33300 
gaaagctgcg aggaccagta gttccaaagc cgctcgccct cggttccggc caacagttcg 33360 
ttctgccagc ggacgaaagc ggcgaagctc gcgaccggcg gcgcgacagg cggaccgcca 33420 
gctgtcctcg cgaggtagat actgcggagt tcatccacca tcaccagcag tgaccagaag 33480 
tcggcgagga tgtgatgcac cacgatggcc agaacctgat ccttccccga ctgcaccagg 33540 
agacgcgagc ggaaacagtt ttcgccgaga ttgaagggcg cgtggaagac gccgtcgatc 33600 
agcaccgcct catcgtccgg cgaacacggg atcacttcga aatccaccgg gacgctgctg 33660 
tggaccgttt gaacgggtgc gccgccactc tccgcaatcg tcgttcgcag cgccggatga 33720 
cgatccacca ggtcctgcag cgaacggcgc aacgcctgcg gatcgaaagc gcctctcgcg 33780 
cgcgcgatcc acgcgatgtt gtatgcggga ctttccggcg cgcttcggta aataaaccaa 33840 
agcgcctgct ggccggcgct gagagggtag gagagggcag gaaccgaggc ctgcgccgca 33900 
ggttccggcg ccaccgtcgt gcgttcgctg aggccgctta gatcgcttag atccctggcc 33960 
agttccgcaa cgctggggcc gtctagaaat cggaccatgg gcagcaagac gcgcagatcc 34020 
gtatcgatcc ggttgcgtaa ttgcaccgcc atgagcgagt ccaatcccat acgcaccagc 34080 
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ggctgctgta agtccaccgc cgattccggg cactgcagtt tttttttttt tttttttttt 34140 
tttttttttt tttttttttt tttttttttt tttttttttt ttttaatgcg gtagtttatc 34200 
acagttaaat tgctaacgca gtcaggcacc gtgtatgaaa tctaacaatg cgctcatcgt 34260 
catcctcggc accgtcaccc tggatgctgt aggcataggc ttggttatgc cggtactgcc 34320 
gggcctcttg cgggatgatc cctgtcagtc atgcgggcaa cttagccgag ccctacgaca 34380 
ccgcccgtgg gaaggtgagt gtctaactgc gtgacaacgc cagcgcacag cggcggacaa 34440 
ccgcgagcac ccatggactg gcgccgcagg tgagaagcac actggcccaa ggtcgagcgc 34500 
ccacccaagt tgcttcggga cgaagaggtc gtgggttcaa atcccgccac cccgacagag 34560 
aaacaccagg tgaggcagac cgtaacgtta cggtctgcct cacctgtttt ctgtgcgtgt 34620 
ctatctgcgt gactatcgcg ccggaccccg cttgaagatg ccgtccatga ccacagcgcc 34680 
ggtctggatg acgggccgga tctgcttccg gtagacctcc tcagtcacgg ccgtaccgga 3474 0 
gtgtccgacg agccgggaga tctcctccag cgggacgccg cggtcggaca gcagggacac 34800 
gaagctgtgc ctcagctccc tcggtgtcca ctcgtcggcg ttgatcccgt tggcatcctt 34860 
gagcgcctgg cggaaggcgc gccggacgtt agtcgcgtcg agcggcttgc caacggccga 34920 
cgagaagacc aggccgtgtt cctcccactt gtcaccggcg gcgagccgtt cccagccctg 34980 
gtcctcaaag tgctgccaga ggacctccac gcaacgcgcc ggcagggcga gcgttcgccg 35040 
agacttccgg gttttcgtgt ccccaccgcg ccggaccgag cgccagacgg cgatgtgcgg 35100 
aggctgcggc ggctcaacgt ccggacttcc cttgaggaag acgtggtccc aggtcagcgc 35160 
ccgcagctcc tcggtgcgcg caccggtcag cagggcgacg acgatgtagg cgtgcatcga 3 522 0 
cgtgccctcg gcagcattca gcaccgcctc ggcctgggcg aaggtgagcg ccttggacgg 35280 
ccggccaggc tggccctggg gcacagagca cagctccacc acgttgcgct tcaccttgtc 35340 
acgcgccatg gcccgcttga ccgcccggtt caggcaggag tggaccgcct gaaggctgcg 354 00 
cgtgctcaga gtctgagcct tggcggccag ccagcggtcg acgtcctctg cgctgaggtc 35460 
acgcagcttc cgggcaccca aacccggtat gacgtgcttc tggcttaggt gggtgcagtt 35520 
ctcgacggtg cgctggtcac ggccagcgag accgtaggca agccagtcgt tcaccgcgtc 3 5580 
ggcgacggtg taccccgtgg gtgcgatcgc gagaccgtct tcgtggtcac gcagaacctc 35640 
tttgagcttg ttcttagcct ccgtcttggt cttgccactc ccccgcttga cgatccgctt 35700 
accgctcgga tcgaagccga ggttcgccgt ggcgatccag cgctgtctct tctcgtccca 35760 
gtggaggccg ccgtcacccc ggctacgtcg cttggccatg gatcgatccc ctgcccggca 35820 
aaatagagtg ttcctctgcc ctctttagca ttcagtgtat ccattaccgt catcaattgc 35880 
tcactcccgg ggcgcggtgc gttgtcatcg aataaattga gctgcgcgac tccctgactg 35940 
aagaaatccc ccagcatcac gcccgctttt tggtaacgat ggcccgcttg ccagatggca 36000 
tccagagatc gcgtagcagc gttaatgata tccctgctgt cctgagtggg cgtcagcagt 36060 
tttaccgacg cgctattgcc gtaataaggt tcattgagcg caaatggtga cgtcttaata 36120 
aacgtggaga taaaccgaca atattgatgc tcgctgcgaa gtttttccgc cgcccgggca 36180 
gcgtaactac aaatggcctg ccgcatcgac ggataatccg tgatgcgttc accaaacgag 36240 
cgggaacaga taatttcctg cttcgtcggt gcaaactctt ccagttgcaa acagggttcg 36300 
ccgcgcagtt cacgcaccgt tctttcgagc acgacattaa aatgtttacg gataaaccgg 36360 
atatctgtat ccgccaaatc gagaacggtt ttgatcccca tcgcgtccag ttttttgctg 36420 
atccgccgtc caatccccca gacgtcatcc acggggagag cagacattaa tttacgctgg 36480 
cgttccagat ttgataaatc caccacccca cccgtctgcc gctgccattt ttttgccgca 36540 
tgattggcaa gctagcttta tgcttgtaaa ccgttttgtg aaaaaatttt taaaataaaa 36600 
aaggggacct ctagggtccc caattaatta gtaatataat ctattaaagg tcattcaaaa 36660 
ggtcatccac cggatcagct tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat 36720 
tacttcgcca actattgcga taacaagaaa aagccagcct ttcatgatat atctcccaat 36780 
ttgtgtaggg cttattatgc acgcttaaaa ataataaaag cagacttgac ctgatagttt 36840 
ggctgtgagc aattatgtgc ttagtgcatc taacgcttga gttaagccgc gccgcgaagc 36900 
ggcgtcggct tgaacgaatt gttagacatt atttgccgac taccttggtg atctcgcctt 36960 
tcacgtagtg gacaaattct tccaactgat ctgcgcggat cgatccttgc cgagctggga 37020 
tggaagcccg gccgacccac cctggaggag atgatcgagg atgccagggc ctttcacgcc 37080 
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cgccgctgct gagcgtccgc cgccgggccc gcaccgccgt cggccggccc gctccgggct 37140 
cgcagcagcg ggcttcggcg cgggcccggg gctcccgggc cgccgggcgg ggctccgccc 37200 
ggcggccgcc gggggccggg ggcggcgccg ggcggcccgg ggcgtcaggc gccgggggcg 37260 
gtgtccggcg gcccccagag gaactgcgcc agttcctccg gatcggtgaa gccggagaga 37320 
tccagcgggg tctcctcgaa cacctcgaag tcgtgcagga aggtgaaggc gagcagttcg 37380 
cgggcgaagt nctcggtccg cttccactgc gccccgtcga gcagcgcggc caggatctcg 37440 
cggtcgcccc ggaaggcgtt gagatgcagt tgcaccaggc tgtagcggga gtctcccgca 37500 
tagacgtcgg tgaagtcgac gatcccggtg acctcggtcg cggccaggtc cacgaagatg 37560 
ttggtcccgt gcaggtcgcc gtggacgaac cggggttcgc ggccggccag cagcgtgtcc 37620 
acgtccggca gccagtcctc caggcggtcc agcagccggg gcgagaggta gccccacccg 37680 
cggtggtcct cgacggtcgc cgcgcggcgt tcccgcagca gttccgggaa gacctcggaa 37740 
tggggggtga gcacggtgtt cccggtcagc ggcaccctgt gcagccggcc gagcacccgg 37800 
ccgagttcgc gggccagggc gagcagcgcg ttccggtcgg tcgtgccgtc catcgcggac 37860 
cgccaggtgg tgccggtcat ccggctcatc accaggtagg gccacggcca ggctccggtg 37920 
ccgggccgca gctcgccgcg gccgaggagg cggggcaccg gcaccggggc gtccgccagg 37980 
accgcgtacg cctccgactc cgacgcgagg ctctccggac cgcaccagtg ctcgccgaac 38040 
agcttgatca ccgggccggg ctcgccgacc agtacggggt tggtgctctc gccgggcacc 38100 
cgcagcaccg gcggcaccgg cagcccgagc tcctccaggg ctcggcgggc cagcggctcc 38160 
cagaattcct ggtcgttccg caggctcgcg taggaatcat ccgaatcaat acggtcgaga 38220 
agtaacaggg attcttgtgt cacagcggac ctctattcac agggtacggg ccggcttaat 38280 
tccgcacggc cggtcgcgac acggcctgtc cgcaccgcgg atcaggcgtt gacgatgacg 38340 
ggctggtcgg ccacgtcggg gacgttctcg gtggtgctgc ggtcgggatc gccaatctct 38400 
acgggccgac cgaggcgacg gtgtacgcca cagcttggcg taatcatggt catagctgtt 38460 
tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 38520 
gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttacggatca gtgagggttt 38580 
gcaactgcgg gtcaaggatc tggatttcga tcacggcacg atcatcgtgc gggagggcaa 38640 
gggctccaag gatcgggcct tgatgttacc cgagagcttg gcacccagcc tgcgcgagca 38700 
ggggaattga tccggtggat gaccttttga atgaccttta atagattata ttactaatta 38760 
attggggacc ctagaggtcc ccttttttat tttaaaaatt ttttcacaaa acggtttaca 38820 
agcataaagc tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 38880 
tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 38940 
gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 39000 
cgaccacacc cgtcctgtgg atctgcctcg ctggcctgcc gcagttcttc aacctcccgg 39060 
cgcagctttt cgttctcaat ttcagcatcc ctttcggcat accattttat gacggcggca 39120 
gagtcataaa gcacctcatt acccttgcca ccgcctcgca gaacgggcat tccctgttcc 39180 
tgccagttct gaatggtacg gatactcgca ccgaaaatgt cagccagctg ctttttgttg 39240 
acttccattg ttcattccac ggacaaaaac agagaaagga aacgacagag gccaaaaagc 39300 
tcgctttcag cacctgtcgt ttcctttctt ttcagagggt attttaaata aaaacattaa 39360 
gttatgacga agaagaacgg aaacgcctta aaccggaaaa ttttcataaa tagcgaaaac 39420 
ccgcgaggtc gccgccccgt aacaaggcgg atcgccggaa aggacccgca aatgataata 39480 
attatcaatt gcatactatc gacggcactg ctgccagata acaccaccgg ggaaacattc 39540 
catcatgatg gccgtgcgga cataggaagc cagttcatcc atcgctttct tgtctgctgc 39600 
catttgcttt gtgacatcca gcgccgcaca ttcagcagcg tttttcagcg cgttttcgat 39660 
caacgtttca atgttggtat caacaccagg tttaactttg aacttatcgg cactgacggt 39720 
taccttgttc tgcgctggct catcacgctg gataccaagg ctgatgttgt agatattggt 39780 
caccggctga ggtgtttcga ttgccgctgc gtggatagca ccatttgcga tagcggcgtc 39840 
cttgatgaat gacactccat tgcgaataag ttcgaaggag acggtgtcac gaatgcgctg 39900 
gtccagctcg tcgattgcct tttgtgcagc agaggtatca atctcaacgc caagcgtcat 39960 
cgaagcgcaa tattgctgct caccaaaacg cgtattgacc aggtgttcaa cggcaaattt 40020 
ctgcccttct gatgtcagaa aggtaaagtg attttctttc tggtattcag ttgctgtgtg 40080 
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tctggtttca gcaaaaccaa gctcgcgcaa ttcggctgtg ccagatttag aaggcagatc 40140 
accagacagc aacgcgccac ggaaaaacag cgcatacaga acatccgtcg ccgcgccgga 40200 
caacgtgata attttatgac ccatgattta tttcctttta gacgtgagcc tgtcgcacag 40260 
caaagccgcc gaaagttaac ttgtttattg cagcttataa tggttacaaa taaagcaata 40320 
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 40380 
aactcatcaa tgtatcttat catgtctgga tctgacgggt gcgcatgatc gtgctcctgt 40440 
cgttgaggac ccggctaggc tggcggggtt gccttactgg ttagcagaat gaatcaccga 40500 
tacgcgagcg aacgtgaagc gactgctgct gcaaaacgtc tgcgacctga gcaacaacat 40560 
gaatggtctb cggtttccgt gtttcgtaaa gtctggaaac gcggaagtca gcgctcttcc 40620 
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 40680 
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 40740 
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 40800 
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 40860 
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 40920 
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 40980 
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 41040 
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 41100 
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 41160 
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 41220 
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 41280 
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 41340 
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 41400 
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 41460 
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 41520 
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 41580 
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 41640 
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 41700 
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 41760 
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 41820 
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tgcaggcatc 41880 
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 41940 
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 42000 
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 42060 
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 42120 
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aacacgggat 42180 
aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 42240 
cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 42300 
cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 42360 
aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 42420 
ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 42480 
tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 42540 
ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 42600 
acgaggccct ttcgtcttca agaattcgcg gccgcaatta accctcacta aagggatccc 42660 
tatagtgagt cgtattatgc ggccgcgaat tctcatgttt gaccgcttat catcgat 42717 
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<220> 

<223> Description de la sequence artificielle: insert 
d'ADN du cosmide a26Gl - brin codant 

<400> 114 

actgcagtgc ccggaatcgg cggtggactt acagcagccg ctggtgcgta tgggattgga 60 
ctcgctcatg gcggtgcaat tacgcaaccg gatcgatacg gatctgcgcg tcttgctgcc 120 
catggtccga tttctagacg gccccagcgt tgcggaactg gccagggatc taagcgatct 180 
aagcggcctc agcgaacgca cgacggtggc gccggaacct gcggcgcagg cctcggttcc 240 
tgccctctcc taccctctca gcgccggcca gcaggcgctt tggtttattt accgaagcgc 30O 
gccggaaagt cccgcataca acatcgcgtg gatcgcgcgc gcgagaggcg ctttcgatcc 360 
gcaggcgttg cgccgttcgc tgcaggacct ggtggatcgt catccggcgc tgcgaacgac 420 
gattgcggag agtggcggcg cacccgttca aacggtccac agcagcgtcc cggtggattt 480 
cgaagtgatc ccgtgttcgc cggacgatga ggcggtgctg atcgacggcg tcttccacgc 540 
gcccttcaat ctcggcgaaa actgtttccg ctcgcgtctc ctggtgcagt cggggaagga 600 
tcaggttctg gccatcgtgg tgcatcacat cctcgccgac ttctggtcac tgctggtgat 660 
ggtggatgaa ctccgcagta tctacctcgc gaggacagct ggcggtccgc ctgtcgcgcc 720 
gccggtcgcg agcttcgccg ctttcgtccg ctggcagaac gaactgttgg ccggaaccga 780 
gggcgagcgg ctttggaact actggtcctc gcagctttcc ggccagcttc cggttctgaa 840 
tctcccgtcg gatcgtccca gtccgccggt gcagagtttc cggggaaact ctcactcgtt 900 
ccgaatcgaa cccgcgctga ctgcgaaact gaaggcgctc gcgcggcggc agaacgcgac 960 
gctgcatgcg acgctgatgg cggcgtttca agtgcttctc tcccgttgga cctcacaaga 1020 
agagatcctg accggcaccc tcaccaacgg tcggacgcaa ccggaattcg ccgatctcgt 1080 
cggatacttc gtgaatcccg taatcctgcg aggagaactt tcaggcgatc cggatttcaa 1140 
tacggtgctc gcccggattc ggcaaacgct tctcggcgcg atcgagcacc aggagtaccc 1200 
gtatgcccgg atcgtggagc ggttgggtcc cggactgcgg gttctattcg tgctccagca 1260 
gcctcatcgc attcccgaat ccgtgccgtt catgttgggt cagtccggcg gtcgcatggc 1320 
ctggggcagc ctcacactgg agtccctggc gatgccgctg cgacagagcc ggtttgacct 1380 
ggatctgatg atggtcgaaa ccgatggagg cctctccgcc tttctgcaat acaacacgga 1440 
catttttgat gctgccacga ttgaacgtct ctccttgcac ttcgccgtgc tgctggaagg 1500 
aatcgcggag aatcccgcct gtccagttgt cgatctaccg ctgctgacaa cccgggaacg 1560 
catccagctg ctcgaagagt ggaatgcgac cgccgcggaa ttcccgtccc aatgcgtgca 1620 
cgagctgttc gaagctcagg tggagttgac gcccgacgcc atcgcgttga gcttcggtga 1680 
gcagaatctg acatatcgcg aactcaacgg gagcgccaac cggatcgcgc actatctccg 1740 
ctcgcgcggc gctggacccg gcgaaatggt tggcatccat gtcacgcggt cgctcgaaac 1800 
cgtcgcaggg ctgttgggcg tcctgaaggc cggcgcggcc tacgttccgc tggaaccgga 1850 
atatccggcg caacgtcttc ggctgatgct ggaagagacc aggccggtcg ttgtgctgaa 1920 
tgtcacggaa tcggaagtat ggacgcagcc cgacaccaat ccgaacccgc tcgcgactcc 1980 
cgccgatctc gcctatgtcc tgtacacctc cggttcgacc ggccggccga aaggcgtgca 2040 
aatcacacac caggccgtcg tcaattttct ttcgtcgatg cggcatgagc cgggcatcag 2100 
cgaccgcgat acgctgctcg ccctcacgac gttcatgttc gacatttccg cgctcgagat 2160 
ctttttgccc ttgagcgccg gcgcgcgcgt cgtggtggcg aaccaggaga cggccgtcga 2220 
tggtgagagg ctggcgaggg aactcgcgcg cagcaaagcg acaatgatgc aggcaactcc 2280 
cgccacctgg cgtctgctgc tcgcatccgg ctggcccggc gaccgccgcc tgacggcgct 2340 
ctgcggcggt gaagcccttc ctcgcgatct tgccgaccgg ctcctgcaac gaaccgcggc 2400 
gctatggaat ctttacggac ctaccgaaac gacaatttgg tccgccatcc aacgggtgac 2460 
gacaggtgac ggaccggttt cgattggccg ccccatcgca aacactcagc tctatgtgct 2520 
tgacgatcgg atgcagcccg cacccatcgg tgttgcgggc gaactgtaca tcggcggcgc 2580 
cgggctcgcc cgtggatacc tgaatcgtcc ggaactcagc gcggacaagt tcgtcgccaa 2640 
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ttcgttcgac cctcatggca ctcggctgta tcgcacggga gatctcgccc gccgccaacg 2700 
cgacggcgcg ctcgagtatc tcggccggat cgaccaccag gtgaagatac gcgggttccg 2760 
catcgaaacc ggcgagatcg aggccgcggt ccgcagtcac ccggcggtcc gacatgctgt 2820 
ggtcaccgcc agagaaaatg acgcggccgg taagtatctg gcggcctaca ttgtccccct 2880 
tgctgacggg catcgcgcga cggcagccgc cgacacattc cacgaccgag tcgagtccga 2940 
gcacgtgacg cagtggcaat ccgtctggga caccacatat gaacagaatg cgccgaacgc 3000 
ggatccggag ttcaacatcg tcggctggag aagcagtgtt accggagagc cgattccagc 3060 
tgccgagatg cgggagtggg tgcaggattc cgtcgatcgc atcctggcct cgcggccgcg 3120 
tcgcgtgctc gagattggct gtggtacggg actgctgctc ttccgcgtcg ctccccactg 3180 
ttcggagtac tgggccacgg acttttcgca gaaggcgctg gactacatcg ccgctcacgc 3240 
ggaccgcacc ggcctggcaa atgtccgcac gttccggcag gcggccgacg acgcgtgcga 3300 
gatcgacagt cgctcgtgcg atgcggttgt tctgaactcc gttatccagt acttccccgg 3360 
cgaagcgtat ctgcggcgcg tgctggccga ggcggtgcgt gtggtcaaac cgggcggcat 3420 
cgtatttgtc ggcgatgtcc gcagtctccc gctgctggag acgttttacg cttctttaga 3480 
agttcagcgc gcacccgcgt cgttgacccg gaatgagttt cggcaacgcg tgcgttcgct 3540 
cgcgtcgcag gaagaggaac tcgtggtcga tcccgcgttc ttctttgctc tccgcgaaca 3600 
gattccggag atcggccgga ttgaaatcct gccgcgtcgc ggccggtcgc ataacgagct 3660 
gacccgcttc cgctaccagg cgatcctgca tatcggatcg cgggaagcgg aggagccgga 3720 
atcggatcgc aggcgttgcc agaccgcggc cgaaatacgc agagtactga cggacgctca 3780 
gccggagttg gccgcattta ccgagattcc gaacgcacgg ttgaccgccg aaagcgccat 3840 
tgtgacctgg atgaacggtg acgaagctcc agagacactc ggggagttgc gggaccggct 3900 
gcgccagacg tcgccttccg gcgtcgatcc cgccgatcta tggcgtatgg acgaagacct 3960 
gccgtaccgc gtggcaatcg actggagcag tcatgggcca cacggacgct tcgacgcgac 4020 
cttctgccgt gcggcggccg gtccgccggc ttcccgtccg cgacgccgcc tggccggccc 4080 
gtatacgaac gatccgctgc gagccgtcta tacgcgcacg gttgtgccgc agttgcgtac 4140 
tcatctgaag gagaagctgc ccgactacat gatcccgacc gcgtgggtcg tgctccacga 4200 
aatgccgctg acgcccaacg gaaaaatcga ccgtaacgcc ctgcccgatc ccgagcccag 4260 
ccggcgagcc cacgccgaag cattcacgcc tccggaaact ccggtggaac aggtactcgc 4320 
ccacatttgg ggcgaggtgc tcggcatgga tggcatcggc gtccatgatc acttcttcga 4380 
ctctggagga cattcgctgc tggtcacgca gatgatcgcc cgcgtgcgcg acatgctcca 4440 
cgtggaagtg ccctttcgaa ccgtgtttaa cgcccccacg gttcgaggct tcgccgtcgc 4500 
tattcaggac ggcgtagacc caggatgggc aaggcgagcc gccgatttgc tgatcgctgt 4560 
ttcccaaatg tcagatgttc aaatcgagcg tatgatgagc gccgcccaag actaggaaca 4620 
cagcgggttg taatgcagaa ttcgtcgcca aataccatag acctctcgct cgcccgccgc 4680 
caattgctcg accgtctgct gcaggaaaac agccccgaac atcgcatccc gcggcgtgaa 4740 
aaccgggatg ccgcaccctt gtcgctggcc cagcagcggc tttggtttct ccatcagctc 4800 
gacccggatt ctcccgccta caacattccc atagcgctgc atatccgagg tccgctggat 4860 
attcgcgtcc tcctgcggag tctggaggcc gtggtgcagc ggcacgagag cctgcgcagc 4920 
tgcattggcg gtgtggatgg agaggcgcgc cagagcctcc tggcgcgagt gacactggaa 4980 
cttccggttg ttcaggctga cggaatcgca gaagcgcggc aaatggcctt gcgtgatgcc 5040 
cagatcccgt tcgacctgcg aaaacccccg cttctgcgga ccaagctgat ctgcctcgat 5100 
gacaagcagc agattctcct gctgacgttg agccacatca tcgcggatgc gtggtcggtc 5160 
gagacgttcg tc'cgcgacct gacgcgatcg tacgaagcgt tcgtgcaggg gcggccatcg 5220 
ccgctcatgg aactgccgat tcagtatggc gactgggccg tccatcagca gacgtcgctg 5280 
aaccaaaccg cgcagcagta ctggaagaaa cagctgtcgg gcaccttgcc tttcctcgac 5340 
cttcctaccg atcgcccccg gcccgcgcag cagacctggc ggggcgccgt ggagaccaca 5400 
gccctcggcc gtgatttgac cgatggactc cacgcgtttg ccttgcgtga aggagcgacg 5460 
gtgttcatga cggcaatcgc ggcgtttcag gtgctgctgc atcgctatac cgcgcaggaa 5520 
gacatcctta tcggggttcc agtcgcgggc cgtacacaac gagaaacgga aggtctcgtc 5580 
ggttgtttcg ccaacatgat cgtcctgcgc ggcgatctgc gcgacgatcc gtcgtttcgc 5640 
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agtcttctcg cccgcacccg cgacaccgct ttgagcgccc tctctcatca ggactttcct 5700 
ttcgaacgcc tggttgagga actgcatcct ccgcgggacc tgagccggtc gcctgtattt 5760 
caggtctcct tcgcgctgct gcccgatgcg ccggccatca ccgtcatgcc tgggctcacc 5820 
atctcgcgcg agtacatgca caacggcgga tccaaactcg acctcggcgt gaccctcgag 5880 
ccatccggcg atggactgat ggcgtccgcc gaatacaaca ccgatttgtt cgatgcggca 5940 
accatcgcct ccctgctcga tgcgtaccga accctgctgg cgagcgtggt gacggatccc 6000 
gacgtccgca tttcaaccgc tgcgctgttg tcccccgcgg tccgaagccg gatgctcgag 6060 
cagcacaatg cgacacggcg cgatgccggt ccgaacgggt gtgcgcatga actggtcgaa 6120 
gctcaggcgg aacgcactcc gcacgccgtc gccgttgtct tcgaagacca tcagttgacc 6180 
tacgccgagc tgaatgcgcg ggccaaccgc ctggctcatc gtctgagcgc atccggcgcg 6240 
ggcccgggaa agatcatcgc tctggcgatg gagcgctcgc tggagatggt gattgcgctg 6300 
cttgcgattc tgaagtccgg cagcgcgtac ctgcctctcg atcccgcgca ccccaaggat 6360 
cgtctcgccc ggattctcga tgaagtgcaa ccgcacgcgg tcctcacgca ggaggcggtg 6420 
gctgagatga tggcgatgat ggcgatgatg gcggtcgccg tcgaaccaga agctgcgaat 6480 
ctcgtcagcg gcagcaagcc cgacgatctc gcctacatca tatatacctc cggatcgacg 6540 
gggcgaccga agggcgtgga gatccgccac tcgtcgctag tcaatctgct gcgctccatg 6600 
cagcgcgagc cgggtctgac agccgccgat gggctggtcg ccgtcaccac cgtgtcattc 6660 
gatattgccg gactggagat ctggctgccg ttgatcaccg gcgcccgcgt catcgtcgcc 6720 
acccgcgaga tcgtggttga cggcgagcgg ctcaccaccc tgctggataa gtcgggcgct 6780 
acggtcatgc aggcgacccc gagcggttgg cggcaattgc tggattcggg ctggaagccg 6840 
ggtaaaggct tccgtgtttt ctgcggcggt gaagctctgc cgccggaact ggcgcgccgc 6900 
attctcgata gtggcgtaga gctgtggaat ctttacggac cgacggagac caccatatgg 6960 
tcggccgtgc acaagacaca aagactgggt gcctccgata gcatcgtgcc gatcggccat 7020 
cccatcgaca acacgcagtt atacatcctg gattcgcgca tggagccggt tccccccgga 7080 
gttccgggag agctgtacat cggaggagcg ggactggcgc ggggctatca tcgcaacccc 7140 
gagctcacgc gtgagaaatt ccgcgagtgg cgtgatcgag gacgcattta ctctaccggc 7200 
gatctggctc gctaccgttc cgacggcgca gtcgagtgcc tgggacgagt cgatcgccag 7260 
atcaagctgc gcgggtttcg catcgaaccg gccgagattg aggccgcgat cgagacgcac 7320 
attgccgtga agcaggcgat tacggtcgtg aaggacgatc ggctgatcgc ctatctcgtt 7380 
ccggcaacgg gcgacgtgcg cgatctgcag agcgatttgc ggtcgtggct ggcaacgcgc 7440 
cttcccgatt acatgatccc ctcggcgttt gtcagcctgt cctcccttcc gctgacgccc 7500 
aacggcaaaa tcgacgcgaa cgcgcttccc ggtttgccca caacgccggt tgctgctcgc 7560 
gagccgatgc gcggcgatgt ggtggagacg attgcgtcca tctggcgtga agttctgcgc 7620 
gtggagcacg tcgactatcg gcagaacttc tttgatgtcg gcgggcactc gctaatgctc 7680 
acacgggtgc gcggactgct cgaggagcgc ctggggttga cgctctccgt cgtcgatctg 7740 
ttccggcata cgacgatcga gtcgcttgcc ggcctggcag aaaaatccga acccgccgct 7800 
gcggaacctg cggctgcggt cgcagaagat cggatcgcag ttatcgggat ggccggccgg 7860 
ttcccggggg cgcgcaatgt ggaggagttc tggcgcaatc tgcgcgacgg tgtggattcc 7920 
atcgccaggc tttcgccgga agatctgctg gcgggcggca tcagcccgga ggtcttccag 7980 
gacccgagct acgtgccggc caagggtctg ctggacggca tcgagttttt cgatgccgcg 8040 
ttcttcggct acagtccgcg cgaagcggag atcatggacc cgcagcatcg cgtgtttctc 8100 
gagtgcgcgt gggaagcgat ggagaacgcg ggatatgcgg cgcgaagcta taagggttcg 8160 
atcggcgttt tcgcgggatg cggcgtcaat acctacctgc tgaacaacct cgccaccgcg 8220 
gagccgttcg atttctcacg cccctccgcg taccagctgc tgacggccaa cgacaaggat 8280 
ttcctggcca cgcgtgtctc ttacaagctg aacctccgcg ggcccagcct gacggttcag 8340 
acggcgtgct ccacctcgct ggtgtcggtg gtgatggcat gcgagagctt gcagcgcggc 8400 
gcctcggaca ttgccttggc cgggggagtt gccatcaatg ttccgcagtc cgtggggtac 8460 
ctgcaccagc cgggcatgat cctgtcgccc gacgggcgct gccgcgcctt cgatgagtcc 8520 
gctcaaggca cggtgccggg caacggcgcg ggtgtggtcg tcctcaagcg cttgagccgc 8580 
gctctggccg atggcgacac gatctacgcc gtcattcgcg gagcggctat taataatgat 8640 
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ggcgccgagc gcatggggtt taccgctcca ggtgtggacg gtcagacgcg attgattcgg 8700 
cgcactcaag agatggcggg cgtgaagccg gagtccatcg gctacatcga ggcccacgga 8760 
acagccacgc cgctcggcga tccggtggag atcgccgcca tcgctgccaa ctttccgaaa 8820 
aacggaagcg gcgatgtgta tatcggatcc gtcaagacca acatcggtca tctagacgtc 8880 
gcggccggtg tggccgggct gatcaagacg gtgcttgccg tccatcgcgg ccagattcct 8940 
cccagcctga atttccagcg tccgaatccg cgaattgatt tcgcaaacac tccgtttcgt 9000 
gtgagtacgc ggctgctcga ctggcccgcc ggaaagaccc cgagacgagc ggcagtcagt 9060 
tcgttcggga tcggcggcac caacgctcac gtgattctgg agcaagcgcc gccggtgacg 9120 
ccggccgcag ctgcgcccga acgatccgca catgtgcttt gcctgtccgc caatacagac 9180 
gcggccctcg aagaactggt gcgctcgtat cgcggccata tggacaacca gcccggtttg 9240 
tcgttcggcg atgtcgcatt cacggccaat gcagggcgcg tgcacttccc gcaccgtatc 9300 
tgcattgtgg cccggtcgag cgacgaggct cgccaacgac tgacggaggc acgacgggtt 9360 
cgcatcgccc agacgcgccc caagattgcg tttcttttca ccgggcaagg tgcgcaatac 9420 
gcgggcatgg gccgccagtt ctacgagtcg cagccggtgt ttcgcgccgc catggatgaa 9480 
tgcgcagctc tgctgaatgg acggctcgat ctgccggcgc tgttggccga tgacgcgttg 9540 
ctcgacgcga ccgccggcgc gcagcccgcg ctgtttgctt tgcagtgggc cttggcgcag 9600 
ttgtggaagt cctggggtgt gacgcccgac ctggtgatgg gacacagcgt cggcgaatac 9660 
gcggcggcgt gtattgccgg cgccgtcagc ctgccggatg cgctcggctt agttgccgaa 9720 
cgcggccggc tcatgcagaa cctgccggaa ggtgcgatgg ctgcggtcag cgccggcgag 9780 
cagcgctgtg ccgcagcgat cacctcgcgc gtctccattg cggccatcaa cggacccgct 9840 
gaggtcgtga tttcgggtgc gccgcaggat attgagagcg cgctggcaac tctacgtgcg 9900 
gagggcatca aaacgcagat gctggccgtt gcgcgcgcct ttcacagctc gagcatggat 9960 
ccgattctgg cggacctgca acgccgggcg gcggcgatcg cgtggcgcaa tccttcgatc 10020 
ggcttggttt cgaacctcac gggcaaactg gccggcgagg gacagctggc gaatccgctg 10080 
tactggcgag atcacgctcg aaaccctgtc cgtttcgccg acggtatcca aacgctcaag 10140 
gacgaaggct gcgacgtgtt tctcgagatc ggtcctaagc cggttctact cggcatgggc 10200 
caaaagtgcc tgcccgacga cgccaagcag tggctgccgt cgctgcgtaa aggccgcgat 10260 
gagtgggaga cgattctcag cagtgtggcg acgctatatc agggtgggtt cgacatcgat 10320 
tggcaggagt tcgaccgtcc gtattcgcga aggcgtgtcg ccctgccggc ctatcctttc 10380 
gagagacgcc gccattggat cgagcggagt tccagaccgg aacctgtagc ggttgcgagt 10440 
ggtctcgtcg ggtgccggct gtcgctaccg gtggcagacg ttatcttcga gtcgaaacta 10500 
tcgacggctt cgcctctact ctcagaccac cgatattacg gttcggtggt ggccccggcc 10560 
gtgtacttcc tggccatggc gctcgaggcg tcggcggagg tgtttggcgc cggccggcac 10620 
acgctggaaa acgtgaactt cgcgcaccct ctgatccttt cagcggagcg cgacacggct 10680 
gttcagctcg tgctttcaca gagcgatgac cggcatgcct cgttccgcat actcagcttg 10740 
tccgacggct cgtggaactt acatgctgcc ggcaatattg ccgcccacgc tggtgtcgct 10800 
cccgtgcccc gactggtcga tgaacgccgg cctgcggtgg atggagacac gtactattcg 10860 
ctgctgcgcc acctcgagat agaactgggg ccgagctacc gccgcataca gcgcattcat 10920 
ttcggtgaac aggaagcgct ggccgcgatt gattccgcaa cgccgctcaa tccccgttgt 10980 
gaattggcgg aagccggcct gcaattgctt agcgccgcgg cgagtcccgc gcttgcggat 11040 
ggcgccgaac atccgatatt cgctccgctc ggtatcgatc gcgtttgttt ttacggcagc 11100 
ctggagggcg ccgtatgggg ggccgcgcaa attctccggc attcgccgga cggctttacc 11160 
ggcgaggcgc agttgctgga ctcggagggc tgcgttctcg gggaacttca gggcgtgagt 11220 
ttccggcgcg tcactcgcgc atgggcgcag cgctcggaac ggaagcccga attgtatgag 11280 
gtcgagtggc ggcccgaacc gctccgccag ccttcgcgaa cgctacagcc tggggcatgg 11340 
ctgatcctgg ccgacagtgg cggcgcggcc cgcgctctgg cagatgcgct cacagctcag 11400 
ggcgagatgt gcgttaccgt gccgccagcc ggcgagtaca tgtccctagt cggtgagcgt 11460 
gactggcgcg ggatcgtcaa cctgtacagt ctcgatgatt atgagctcgg ctgccgcagc 11520 
actctggccc tggtgaagtc cctgaagtcc ggtccgcggc tatggctggt aacggccggc 11580 
gcgcaggcga ccagtgcggt gcacaatccc atgcaggccg cgctctgggg cttcggccgg 11640 
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gtgatcgcgc gcgagcaccc ggatctgtgg ggcgggctca tcgatctgga tcccgacgat 11700 
gcgcatgctt cggcggccgg cgcggccgcg cagatgcgtg atttcgacgg cgaagatcag 11760 
tcggcgtgga gaagcaaccg gcgctacgtg ccgcgactga cccgccgacc cagcgcgcga 11820 
gcggcagtcc gtctggtttc gggcgcgact tatttgatca ccggcgggct cggagccctg 11880 
ggacttacag tcgcgaaatg gatggtggag cacggcgcca ctcgcgtcgt gctggccggg 11940 
cgccggcctc caaacgagga gcagcagcgc gtgctgcaac agattggtgc gacggcagag 12000 
acggtcgacg tcagccggga agaagaggtc gcggatctca ttcgccgcat ccacaccgaa 12060 
acgtcaccgc tgcgcggcgt tatccatgcc gcgggtgtgc tggacgacgg cgtactgctg 12120 
aatcaggact ggacgcggat cgcaagcgtc atggcgccga aggcggaagg cgctgtacac 12180 
ctccatcatc acacccgcga tctgccgctc gacttcttcg tgctcttttc atcggcatcc 12240 
tcgctcttag gtcctgccgg gcaggcaggc tacgccgcgg ccaacgccgt tctcgatgcg 12300 
ctggcgcatc accggcgcgg actgggtttg ccggcgacca gcattaactg ggggcgctgg 12360 
tcgggagccg gaatggccgc gcgcaccagc cagtcgatgg ccggcgtggc gagcctctcc 12420 
gtggacgagg gtctacacat tctcgaggcc gtcctgcatg aatgccccat tcagattgcc 12480 
gcgctaccgg cgggctcgat taccggcgag ttgctgcgtc ccgccgcgct gccttcacct 12540 
caactgcgca cccgcttgaa cgaagccaca ccccggcagc gcgaagccat cctcattgcg 12600 
cacatcaggg agtcactggc gcgctttgtc ggcatcgcga cttccacacc gctcgatcca 12660 
cagcagcctt tgggtgaact gggactcgat tcgctaatgg ccatagaact tcgcaactcg 12720 
ctctcccaat cactggggca gcctttgccc gcgagtctgc tgttcgacta tccgtcgctc 12780 
gatgcgatcg tcagttacgt gctccatgcg gtatttccac ccgaagcatc accggtggaa X2840 
gcgccggagt ttgagaacct cgcccgcgaa gaactggaag cgctgctcga ttcgcggctg 12900 
gcgcaggtcg accagtggtt ggagacgcaa taaacatgag cgggtcagac gatctcagca 12960 
agcttcgccg cgccgtgatt gcgctcgaca aggtgcagaa acgcatcgac cagctggaga 13020 
gcgcgcgcag cgagcccatc gccctcatcg gcgcgggctg ccgcttcccc ggcgcatcca 13080 
atctcgatgc ctattggtcg ttgctgcgcg agggccgcag cgcggtacgt gaagttccac 13140 
ccgaccgctg ggacatcgat gcctactacg atccggatcc cggcgcgacg ggccgaatgt 13200 
acacgcggta cggcggcttc atcgatcagg ttgaccgttt tgacgcccgg ttcttcggca 13260 
tcgctccgcg cgaggcgatc agcctggatc cacagcagcg gctgcttctg gaagtcacct 13320 
gggaggcgat cgagaacgcc gggcttccac ccgaccggct ggcggggagc cggaccggcg 13380 
tcttcatggg gatcttttcc aacgattatt acaacctgca aatgcgcggc ggggatgcgc 13440 
atatcgacgc gtacaccggc acgggcaata cggccagcgt tgccgccggg cgtctctcgt 13500 
acatcctcgg gctgcagggc ccgaacatgg cgatcgacac ggcatgctcg tcatcgctgg 13560 
tcgcggtgca ccttgcctgt cagagcctgc gctcaggtga aagcgacctc gcgctggcgg 13620 
gcggcgtcaa tctgattctc tcgccggatc ggacgatcta cttctgcaag ctgaaggcga 13680 
tggcagccga cggtcgctgt aaggcattcg atgccgcagc agacggctac gtccgcggtg 13740 
agggctgcgg tgtggttgtg ctgaagcgac tctccgacgc gctgcgcgat cgcgatccgg 13800 
tgatggcggt gattcgcggc acggcaatca accaggacgg acgcagcaat ggactgacgg 13860 
cgccgaacgg gcccgcacag gaagccgtga tccgccaggc tgtgggagac gcgcgcttgc 13920 
agacgctgga tgtgagctat gtcgaggcgc acggaaccgg cacgccgctg ggcgatccca 13980 
tcgaagccgg agcccttgcg gccgcgctgg gagcggggcg caccaacggc aacaagctga 14040 
agctcgggtc ggtgaagacc aacttcggcc acctcgaggc ggcagcgggc gtggccgcac 14100 
tgatcaaggt ggcgctgatg ctgcagaacg aagccattcc gccccatctg aatctgacca 14160 
cgcccagccc gcacatcgat tggaacacgc ttcccctcga aatcccggca cggctcaccc 14220 
cctggccggt tgcacccggc gggcggcgcg tcgccggcat caactcgttc ggcttgagcg 14280 
gtacgaatgc gcacgtgctc atcgagcagg cgccgcaaca ggccgcgtcc agtacgcccg 14340 
caccgtacct gcttccgcta tcggcgcgca gtccggaggc gctgcgtgat ctggcgcgcg 14400 
cataccgcga cgtggtgaac gacaaccccg ccgacacctg ctacacggcg tgcgctcgcc 14460 
gcacttcata cgaacaccgc gcggcattca ccgggacgaa cgcgcaggac ttgatggccg 14520 
ggctggacag ttttctggcg ggcaacccga accgcgatac cgccacaggt tttgtgccgc 14580 
gcggccagaa gcgaaaagtc gttttcgttt tgccgggaca aggatcgcag tggcccggca 14640 
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tgggccgcga cctgatggct tctgaaccgg tgttccgtgc cgccatcgaa gagtgcggcc 14700 
gcgccatgca gccttacgtc gactggtcgc tgacgcaaga gttgcagggg ccgctcgacc 14760 
gcatcgacgt gattcaaccg gccctgttcg cagtcggggt cgccttggcc ggactgtggc 14820 
gccattgggg aatcgagccg gacgccgtga tcggccacag catgggcgaa gtcgcggcag 14880 
cgcacattgc aggtgcgctg actctcgatg aagccgctcg ggtgatttgc ctgcgcagcc 14940 
ggatgctcgc cggagtacgc ggccagggag aaatggctgt cgtggaatta gcgctggacg 15000 
aggccatcgc tgccatcgcc gggcgctcgg atcgggtctc gattgccgcc agcaacagcc 15060 
cgcgcagcac cgtcctgtcg ggcgacagcg cagctctggg cgaactgctg cgggaactgg 15120 
aggcgaaaga cgtcttctgc cgtcgcgtga aagtggacat tgcctcgcac agccatctga 15180 
tggactccgt gtgcgcggcg ttgccgggcg tggtgggagc gcttcagccg cggccggccg 15240 
cccttggcat gtactccacc gtcaccggcg cagcgattag cggtgaagag ctggtttctg 15300 
cgtactgggc tcgtaatctt cgccaacccg tgatgctgtc gacggccgtc gccgcagccg 15360 
cggcgggtgg tcatgatgtg tttctggaac tgagtcccca cccgttgttg gtccagccga 15420 
tccaggaaac gctcggagat cgggcagcga ttgccgctgc ctcgttgcgg cgcgatgaag 15480 
acggaaacct cgcactgcgc cggacgctgg gagcgctgct gactaacgga gtcactccgg 15540 
actggtctcg tatttatccc aacggcggcc aaactcgccg gctgcccaac tatccctggc 15600 
agcgtgagcg ttattggatc gatatccgtc cgccgcaggt cgagtctcag gctttgcctg 15660 
gccggcggat cccgtcgccg ctgccggaga tgcagttcga gtccactgtg gaggcgaaag 15720 
atttcgcgga tcaccggctg cacgatgtga tcgtgactcc gggagcgtgg cacctggcaa 15780 
tggcgctcgc cgctgcgcgc caaggtctcg gcgccgggcc tcaccatgtc gaacacgtgt 15840 
cattgacggg cgcgctgacg ctgccggaaa acgatgctgc caggcaggtt caactggtac 15900 
tccgtcatga agagggcggc ggagcttcct tccgcatcta cagccgcgag gattcctgga 15960 
agctgcacag cgaaggcatg ctgcaggcgg gcgattccac ggcatccatc gatctggatg 16020 
cgattcgcgc ccgctgcacg gcggagctca cagccgatgc cttctattcg cgactgtggg 16080 
atcgcggcta tcacttcggt cccaccttcc gaaccatcgg ccccatctgg cgcggcaacg 1614 0 
gtgaggtgct ttgtcgcgtg gacattccgc tgacggaaat gcagacgatc gactgctgtc 16200 
tgcagttgcc cgcggccctc gtccatcacg acgatttgaa agatgtgcat gtgccggtag 16260 
gtctggaccg attctcgctc gctgaagtgc ccactggccc ggtctgggga tacgcggtct 16320 
tgcggccgga ttccacggtg gatgtccgtc tcgtcaccgg caccggcagc gtggtggcgg 16380 
aattggtggg gctgcagtcg agagtcgccc atagcggcca gctcggcgaa tcggagattc 16440 
ccacctggac ggtgcaatgg accgcgtcgg ttcgccgcgg cgatgccaat gccggcaatg 16500 
ctggcggacc ttggctcgtc atcggcgagc cggcgattgc cgagactctg caaaagcgcg 16560 
gccaaacctg ccgcacggcc gatacgtgct cgggtccgcc gtgccgtcaa attgtgtact 16620 
gtccctcgcc gcgcatcgac gacctgcttt ccgtattgcg cagcatcgtg caagcgggct 16680 
ggcctgagcc gccgcgcctg tggctgctga cgcgcggatc tgccgcggtt ctcaactccg 16740 
acaaagatat tgatattcga caagcctggc tgcacggaat tgggcggacg attgcctatg 16800 
agcatcccga gctgcgctgc acgctcgtcg atctcgatgc gcacagcaac gactgcgggc 16860 
atctcgcgac gctgatgctg tcgaatatcg cagaggatca agttgcgatc cggcaaggca 16920 
cggtatgggc gccgcgcctc agtcttcaca agatcccatc cgcacccgat gtggcgttcc 16980 
gtgccgacgc aacctatctg atcacgggcg ggctcggcgg actcggactg caggtggcgg 17040 
gatggctcgc cgccgccgga gcgcgccatc tcgttctgct gggacgcagc gagcgtcctc 17100 
ggccacaact ggaaggtgtc aacgtcaaga tcatccatgc ggacgtggcg gaccggcagc 17160 
agctatcgga tgcgctcgcg atcatcgatc gcgacatgcc gccgttgcgg ggcgtgttcc 17220 
atctggcagg cacgctggcc gacggcatgc tgctcaatct cacgaccgaa cgcttcgaag 17280 
ccgccatggc tccgaaagta gccggcgcgt ggaacctgca cgaactcacc gccggccggc 17340 
cgctggatca ttttgttctc ttctcttccg ccagcgcgac agtgggatct cccggccagg 17400 
gcaactacgc cgccggcaat tcatttctcg acgcgctggc tcatctgcgc cgcgcccagg 17460 
gtcttcccgc cgtcagcatc gcgtggggac cgtggacaca ggttggtttg gccgcacagg 17520 
cgaaccgcgg agaccgtctg gccgcgcgcg gcatctcggt tattcaaccg caacagggat 17580 
tgcgcgcgct ctacaaagca ttgacgcaga ttcggccgca cgtcgctgtc atgaacttcg 17640 
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atatcgcgca gtggctccgt tactatccgt cggccgcatc gatgtccctg ctggccggca 17700 
tcgcacccgc ggccgcggac accaaaccgg cggccgacat gcgcagcgag ctcctggcag 17760 
ttccagccgg gcggcagcgc cgcgcgcggc tggaaacgct gctgatgcac gaagccggac 17820 
acgtgctgcg cttcgatcca gcgaaactcg acggcagagc gacgctgggt gatctcggat 17880 
tcgattcgtt gatggccctc gagtttcgca accgtctgga agccgggctg cgcgtcaagc 17940 
tttctgccac cctgatctgg cgttacccga cattctccgc cctggcgcag catctcgccg 18000 
acaagctcgg cctgccgctg gaaagcatgg ccggcaatgc tgaaccttcg accgttgctg 18060 
ccgttgctac ccttgctacc gttggcaccg ccgcgggcga ggaccggagt cccgccgctg 18120 
cagacgatct cgacgccgtc gcaaaccaga tcgccgggtt gggggacaaa gaaatcgaag 18180 
ctttgttgaa acagaagttc gctcattttt caggagcctc cgagtgagtt cgatatccga 18240 
gcgattcccc aaccttacgc cgttgcagca ggcgtacctg acgctggagc acatgcagcg 18300 
acgtctcgat gcggccgaac gcgacgcgcg cgaacccatc gcgatcgtgg gtctgggctg 18360 
ccggtttccg ggcggcgatg ggcccgatga gttctggcag atgttgcgca gtggagtcga 18420 
tgctattcgt gaggtaccgc ctggacgatg ggacgaggag tcggtccggc gcatcctgaa 18480 
atcgttgaac cccgccacgc cggtgaagat tcaagccgga tttctcgatt ccatcgatgg 18540 
tttcgacaac gattttttcg gcatttcgcc acgcgaggcc gtcagcattg atccgcagca 18600 
gcggctgctg ttggaagtgg cgtgggaggc actggaggat gcggggcaga cgatggaagg 18660 
gctctccggc agccgcacgg gcgtcttcgt cgggatccac agccaaagca gcgactattt 18720 
ctggatgcag accgccgatg gcgcgcgcat cgatccgtat accgccaccg gcacggcgca 18780 
tagcgtgatc gccggccgac tttcctattt gctgaacttg caaggaccca gcatcgcgct 18840 
cgacacggcc tgctcgtctt cgctggcggc ggttcatctg gcgtgccaga gcctgcgcag 18900 
cggcgagtgt acgctggccg tggccggcgg agtgaatctg cgcttctcgc cggagtttat 18960 
gtacgccacc tcgaagatgg gaaccgcctc gcccagcggt cgctgccgcg ccttcgacgc 19020 
ggcggcggac ggcatcgtgt tcggagaagg ctgcggcgtg gtggtgctga agcgcctgtc 19080 
cgatgcactc gcggccggag accgggtgtg ggccgtggtg cgcggctccg cggtcaatca 19140 
ggatggccgc tcggccgggc tcaccgctcc caatgtcgtg tctcagcagg tcgtcatccg 19200 
gtcggcattg gccaatgcgg gcgtcgcggc gcagcagatc ggttacatcg aagcccatgg 19260 
cacggggact ccgctcggcg atcccatcga gatcgaggcg ctggcggaaa ccgtcggcct 19320 
cccgcgacct gtcggcgatg tgtgcgcggt cgggtccctg aaatcgaaca tcggccacct 19380 
ggagggagcg gcaggcatag cgggattgat taaagcggtg ctcgcattga gtcacgagac 19440 
gataccgccg agcttacacg tgagacagct gaacccgaat atccggttgg agggaacgtc 19500 
gctcgacatt gtgaaggaag tccggccgtg gcccgcgggt tcgagacgaa ggtttgcggg 19560 
cgtcagcgcg tttggttggt ccggcacgaa cgcgcatgtc gttcttgaag aagcggcgcc 19620 
gactggtaga ggcgaagctg cgagcgggtt ccattcccga ccccccgccg ccgctgcgcg 19680 
ggcggctgtc cccctcgcgg agggggacac tgggggcact cccgacattg caggcactcc 19740 
cgacactgca gacactcccg acactgcaga cactcccgac attgcaggga ctgcaggcac 19800 
tgcggcaact acgggcattg cagacgcgat gtatgtgctt ccgctgtccg cgcatggtgc 19860 
ggacgaactg cgtcgggtgg cgcgggcata cggggaattg ctgacagcgt cgcacgcacc 19920 
gagcctgcgt gatctttgct acacggccgc agtccgccgc acgcatcacc gatgccggct 19980 
cgctgtttcc ggcagaacgg ctgaagaact ggcggcgcag ctccagggga tcacgatccc 20040 
ttcccagcga cggaagacgg tattcgtctt ctcgggacag ggatcgcaat ggatcggaat 20100 
ggggcgcagc tggatggacc gcgaacccgt tattcgcgag gcgttggaac gctgcgaggc 20160 
cgccatgcgg ccttatgtgg actggtcgct gaaagaagaa ctggcgaagc tcgaccgcgt 20220 
cgaggtcatt cagcctgcgc tcttcgcgct gcaggtcgcc atcgccgcat tgtggcgttc 20280 
ctggggaatc gagccggatg ccgtcatcgg gcacagcatg ggagaggtcg ccgccgctca 20340 
tgtcgcgggt gcgctgacgc tgcaggatgc ggcgcggatc atttgcagcc gcagccggct 20400 
gttgagccgg atcagcggcc tgggcgggat ggcgatggtg gagctgccgc tcgcggaatg 20460 
tgaggccgtg ctgtcgactt acacggaacg actatcgccc gcggtgtcga acggacccaa 20520 
ctccaccgtc atctccggtg aagtcgaagc cctggccgag gtcgtcgcga cgctggagcg 20580. 
gcgaggcgtg tcttgccggc cggtgaaagt ggacttcgcc gcgcatagcc cgcaagtgga 20640 
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cccattgtgc gacgaactcc tgcagtcgct cgacgggatt caaccgcggc ccgcgaccat 20700 
acctttttac tccacggtga ccggcgcgac gctggagacc accagcctcg acagcacgta 20760 
ctgggctcgc aatctgcgat cgccggttct gttctggcag ggcatccgcc atcttgccga 20820 
cagcgggcac gatgtctttc tcgagatcag ccctcatccc atcctgctgc ccgccatcgg 20880 
cggcaatgcg gcgctggttc cgtctctgcg ccgcgaccag gacgaacgcg gttccatgct 20940 
cacgtcgctg ggcgccctct atgaggctgg gcacactgtc gcatggcgga ccgtgtaccc 21000 
ttccggcaat tgcgtgcgcc tgccccggta tccctggcag cgtcgtcgtt tctggctcga 21060 
cgcttccccc gcgcgacacg cgatcacgtt gggcaatccg ctgttgggaa aacgcgtcga 21120 
agcctcgacg caacccggca ctttcttctg ggagacggaa ctcagtctcg cttccgtgcc 21180 
ttggctggca gaccatcgcg tgcagggcga agtcgtcttg ccggctactg cgtatctcga 21240 
tatggctctg gccggaactt ccgagacctt cggtgaaagt ccgtgcgtgc tggagcatgt 21300 
gactttcaca cagatgctca ttgtgccgcg cgacggcagc atgacgttgc agctggccat 21360 
cgcggtcgat agacccggga tggcgtcgtt tcggatttcc agccggcagg catcgacatg 21420 
ggtcctgcat gcttccgggg acattcgtca gacgcctgcg gatgcatcga ccgtcccgcc 21480 
ggattctgcg gagacggtgc aggcccgctg ccccacagtg gtgccggcgg cggagctgtg 21540 
gcgtcagatg gcggagcacg gcgtcgagta tggtccggct ttccgcgcgc tcgagcagat 21600 
ctggagttgt ccaggtgagg cgatcgggcg tctgcgtagc tcggaaacgc gttccactgc 21660 
gccggcgttc ctcgatgcat gtctgcagat catcgccgcg gcgtttggtc ccgccggtgg 21720 
aacctggctg cccgccggca tcgaccggat gcgctggctg catcccgcac gttccgtggt 21780 
gtggacgcat gcgcggctgg aaggacctat cgccgatctg tcgctgctgg acggagaggg 21840 
acaactggtc gcccgcatcg agggtctgcg gctgcagcgc ctggatgcgt cggagcgcat 21900 
cgacatgcgc ggctggttgc acgaactgcg ctgggtcgct cagccgcacg ccgctgcaga 21960 
gccgccggcg gcgcgagcgg cgcggtcatg gctcattgtc ggcgctgtgg atagcgcgct 22020 
caccgcatgg ctgcgcgcta ccggcaaccg cgtgacgcag acctcgccgg aaaagctcga 22080 
tgaactccag ccgccgctcg aggaaatcgt gtttttgctc gagcacgaac cctcatgcga 22140 
ccgcattctg catctcctcc agaccctggg gcgcacgccc tggcgtcaag caccgcgcct 22200 
atggctggtc acgcgcggcg cgcagccggt cgatggacag atcctgcaag ccggtatcgc 22260 
tcaggcgcct ttctggggtt tgggccggac cgtgcattac gaacatccgg aactgaactg 22320 
cacgctgatc gatctcgatc ccgccggcgg cgaagaggaa ctcctgcacg aactgctgac 22380 
gaacaacggc gagaatcaaa tcgcctttcg cggcggcgcg cgttacgtcg cgcgcgtggc 22440 
tcggcacgaa gcggatatgc aacccgccat gttcaaggcc ggcgatcggc cgttccggct 22500 
cgagatcgat gcccccggag tcctcgaccg gctgcgcttg cgggccacat cgcgccgccc 22560 
cccgcaagcc ggtgaagtgg agattgaagt ctgcgccgcg ggcctgaact tcctcgacgt 22620 
tctgctcgcc ctcggcgtta tgcccgacga tgcgcccggc gcgattgccg gcagcccgcg 22680 
cctgggcggc gaatgctcgg gccgtatcgt ggccatgggg aaaggcgtca ccgactttcg 22740 
catcggagat gaagtcgtgg cccttgcgcc ttgcagtttc ggtcgcttcg tcaccacgcc 22800 
cgccttccgc gttgccttga agccggccaa cattcccgcc gaacaggccg ccgccctgcc 22860 
tatcgcgttt ctcaccgccg attacgcgct ctcgcgagcg gcgcggctgg cgcccggcga 22920 
acgagtcctg attcacgctg ccaccggcgg tgtgggattg gcggcaatcc agatcgcaca 22980 
gcgtgcgggc gcggagatct tcgctactgc cgggagtccg gaaaaacgag cgtatctgcg 23040 
ctcgctgggc atcgcgcatg tttcggattc gcgctcgatg gctttcgtgg acgacatccg 23100 
caattggacg aatcaagaag gagtagacgt cgtcctgaat tcgctttccg gcgatctgct 23160 
ggaggcgagc ttcgatctgc tgcgcgatca tggacggttc atcgagatcg gcaagcgcga 23220 
ttactatgcc ggccgcaagc tggggcttcg cccgttcctg aagaacctct cgtacacgct 23280 
ggtcgatttg ctcggcatgt ccctgaagcg cccggcattg acccgggagc tgctgcagga 23340 
gatggtcgca aaattcgaat cggaaacctg gcggcccctg gaaacgcgag tgacgaccat 23400 
caccgaatcg gtggaggcgt ttcgcaccat ggcgcaggcg cggcacatcg gcaaaatcgt 23460 
catggcgatg cgagattgcg ccaatgcgcc catcgcaccc ctacgctcgg cgttcgatag 23520 
cgagggaacc tacttgatta ccggcggact tggcgggctc ggtcttaccg tcgcacgctg 23580 
gatgatcgga cgcggcgccc ggcggctggt gctgctgagc cgccgcgcgc cttcacccga 23640 
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ggtccagcaa gccatcgccg tcatggacgc agatgtccgg acggtgcagg ccgatgtttc 23700 
tcagcgcgat gaactcgagc gcgtgatctc ttccatcgat cgattgcgcg gcgtgattca 23760 
tgccgcagcc gttctcgacg atgcgctgct actgaaccag acggaagcgc atttccgcaa 23820 
cgtgatggcc gcgaaaatcg acggtgcctg gaacctgcac ttgctcaccc gcgactgccc 23880 
gctcgatcat ttcgtgctct tctcctccgc tgcaggactg ctgggcgcgc ccgcccaggg 23940 
aaactacgcg gccgcgaacg cctttcttga cgcgctggcc tactaccgga aggcccaagg 24000 
cctgccggcg ctgagcatcg gttggggtgc gtggtcggag gtcgggctgg ctgccgcgca 24060 
ggacaatcgc ggatcgcggc tggctttgcg cggcatggaa aacctgacgc cgcaacacgg 24120 
cctcgctatt ctggaacagc tgctgaacag ctcggcttgc cacgtcgccg cgatgcccat 24180 
caatgtccgc cagtggcggc agttctatcc caaggcggcg cagtctgcac tgttcgagct 24240 
tttgcatgac gacgcggcga gcgaagccga tgcgccaaac gcgttgcgcg cgcggctgca 24300 
atcggccgag cctcagaccc gcaggacatt gctcgaagaa catctacagc agcagctggc 24360 
gcgcgtgctg cgcatcgact ctcaaactat cgatcccctg cgcccgctga aggaactcgg 24420 
cttcgattcc ctcatggccc tggagtttcg caaccgtctc gaactcacac tgggtctcac 24480 
gctccccgcg accctgattt ggggtcatcc cacgctggcc ggtcttgccc cgcacctggc 24540 
gtcgcaaatg ggactgccgc tggtcgaagc gcaggccgcg gctgctgcgg aaggagacag 24600 
ccgcgccatg aaaactgcac tcagcgggtt ggacgacatg tcggaagaag cagccgtggc 24660 
tgcgctccga ggagcaaggt cgtgagggaa aaaattgcgc ccatgtcgtc ggtcaaactc 24720 
gcgctattgg cgcggaacat gcggcaaaac atcgcaggct tcgacctggt tcacgccgaa 24780 
cccatcgcca tcgtcggcat ggcgtgtcgt tttccgggcg gcgcgaagaa tccggacgcc 24840 
ttctggacgc tgttgaagaa cggtgtcgac ggtgtcaccg aggtgccgcc agaccgctgg 24900 
aactcggacc agtactactc ctccgatccc gatgctccgg gcaaggcgta tgcgcgatat 24960 
gccgccttcc tcgaacgcat tgacggtttc gatgcggaat tcttcggcat ctccccccgc 25020 
gaagctctga acatggatcc gcagcagcgg ctgctgctgg aagtgtgctg ggaagcggca 25080 
gaggacgccg gcatctctcc cggccctctg gcgggcagcg cgaccggcgt ctttgccggc 25140 
tcctgcgccc aggacttcgg actgtttcag tacgccgacc ctgcccgcat cggagcttgg 25200 
tcgggttccg gcgtggcgca tagcatgttg gccaatcgca tctcctatct gctcgacctg 25260 
cgcggtccga gcatggcggt cgatacggcc tgctcctccg cgctcgtcgc cgtccatctg 25320 
gcttgccaaa gcctgcgccg gcgcgaatgc gatgcggcat tcgccggcgg agtgaacttg 25380 
atcctgactc ccgagggcat gatcgctttg tcgaaggctc gcatgttggc gcccgacgga 25440 
cgctgcaaga cgttcgacgc cgcagccgac ggttatgtgc gcggcgaggg ctgcggcatc 25500 
gtgctgctga agcggctctc cgatgcgctg gccgatggcg atgccatccg tgcagtcatc 25560 
cgcggctcgg caatcaatca ggacggacgg agcaatggca tcacggcgcc gaatctgcag 25620 
gcgcagaagg cggtcctgca agaggcggtg gccaacgcgc acatcgatcc atcccacgta 25680 
tcgttgatcg aggcgcatgg cacgggcacg tcgctgggcg atcctatcga gatcgaggcc 25740 
ctgcagtcgg tctacgacgc gccggactct gcgccttgtc tgctgggttc cgtaaagacc 25800 
aacatcgggc atctggaggg cgcggcggga atcgccgggc tgatcaaagc cgtactcgcc 25860 
ctgcagcatc gcaccattcc tccgcacctg cattttcgcc ggctgaatcc gaacatctca 25920 
ctggacggca gccggtttcg catcgccacg gaatcgtcgc cgtggacgtc ggaaggacgg 25980 
ccgcgtctgg ccggcgtcag ctcgttcggt tttggaggga gcaacgcgca cgtcatcctc 26040 
gaagaggcgc ctgcactccc tttgccgaag ccggtcacac gcccgcagct tctcactctg 26100 
tcggcgcgca ccgacgaagc gctcggcgaa ctggccggcc acttcgcgga gttcctgcag 26160 
tcgcacccga atgcgttgct gtccgacgtt tgcttcacca gtcaggttgg gcgcgacgca 26220 
tatagtcacc gcttggcgat caccgccgca gatgcggcag aggctgtagc ggcattggcc 26280 
gcggcgccgc ggcgcgaagt atcgttgcgc cggcggccgg caatcgcttt tctcttcacc 26340 
ggccagggcg cgcagtacgc cggcatgggc gcagagcttt ataaaacgca gcctgttttt 26400 
cgcgacgcgc tcgatcgttg cgccgattgg ctccgtcccc agctcgatgt tccgctgacc 26460 
gttctcttgt tcgagtcggt ttcgccgttg cacgagacgg cgtataccca gccggcaatg 26520 
tttgccctgg aatgggctct ggctcagttc tggctgtcgc tcggcgtccg gccggactac 26580 
gtgctgggcc acagtctcgg cgagtatgtt gcggcgtgtg tggccggcgc ctttagcgtg 26640 
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gaggacggcc tgcggctggt gaccgccagg gggcggctgg tcaatgcgct tccccgcggc 26700 
aaagcggtca tcgttcacgc caatccgagc cgcatcgcgg cgctcgccgc caaggtggca 26760 
gtcgccgcat cgaatgcgcc ggaccgcacc gtgatctccg gcacggctgc agaaatcgcg 26820 
gaagcgcaag atgacctgca tcgcgccggc gtggaaacgc gagagctgaa cgtatcgcat 26880 
gcgttccatt cgccgctgat ggatccgatt ttggacaagt tcgaagcgct tgcaggtgcg 26940 
atcgcgtatc agccgctggc gatcccgctg gtgtcgaacg tcagcggagc cgtattgccg 27000 
aaaggcacga cactcgacgc ccgctactgg cggcgacagt tgcgcgaaac cgtgcagttt 27060 
gaaagcgcga tgcgaaccct ggcggaccgc gagtgcaagc tgtttctgga aatcggcccg 27120 
catcccacgc tcaccacgct ggggcgatat tgtctgcccg atgacggcgc ggtctggctg 27180 
cactccctat ctaagggacg atcggattgg tccgtgctgc tggaaagtct tggcggcctg 27240 
tttaccgcgg gcgtgaatcc cgactggcgc ggtctctatg ccggggaatc acccagccgc 27300 
gtcgcgctgc cgacgtatcc gtttcagcgt gacaccttca gcctgagacg cgtacccgcg 27360 
agagagccgg cgcgcggcgg catgttggga gcgcgcctca acagcgcgtt gggcgatgtc 27420 
atcttcgaaa attcgctaac cacggagacg cctctgctcc atgagcacgt gatctacgac 27480 
gcggtcattg tgcccggcgc ctggcacgtg tcggcatttc tcgaagcggc acaggaagtc 27540 
ttcggtccgg ttccctgcgc cgtctccgat gtcatgatgc ggcaggcact ggccatcccg 27600 
ccggatacgc cggtcacggt gcaagcgatt gtcacacccg gcgaggacgg cgaagcaaag 27660 
gtgcaggtct tcagccagga tggcgattcg tggaagctcc acacggcagc cagtctgcgc 27720 
gcggcgactg ccggcgccgt tcatttcgag ctgccggcgc agccttccga agtcatttcc 27780 
ggcgatgcgt tctacggcgc gatgaacgca cgcggcgtcg atcttggccc cgccttcagt 27840 
tgggtggaag aagtctggcg tcgcgatggc gaggcgctgg ggcgaatgcg tctgccggtg 27900 
gctgaggatg gcgcgaacgc ttaccggctg caccccggcc tgatcgattc ttgttttcaa 27960 
gtattcggag cgacttggcc cgcggagcgt tgccagcccg gcgcatacgt gccggtcggg 28020 
atcgaagcgg tgcgcttcta ccgtccgccg gcaggttctc tgcgctgtca tgcgcgtctg 28080 
cgcccgagct cgagcggccc gttcgtcggt gatctgacgc tggttgaaga gaccggcgcg 28140 
gtcatcgccg agttttccgg actggctgta atgcatgccg gtacgctgca atccgcacag 28200 
tcgtggctgc aggatgtgca gtggcaggag tgcgagcgat cgacaacgtt gaagtccgac 28260 
ggccctggca agccggagga ctggttgctg tgtgccggcg cagacgatgt cgccggtttg 28320 
atgccgcaag agctgcgcgt cgtgtccggc gtcactctcc gccaggcgct ggaacagacc 28380 
cagactttgg tcggccgccc ggcgcggctc tggctgatca cgcgcggcgt gcatcgcatc 28440 
agtgatgacg atgcgactcc cgtcgatcct ttccaggctc cactgtgggg actcgggcag 28500 
gcgatcgcgc gcgagcatcc cgagctgtgg ggcggcctga tcgacctcgg ttgcgacaat 28560 
gccgacatcg ccgccgccat gctgctggat gaaatccgtt atgccggcga cgacaaagcg 28620 
atcgcattgc gcaacggacg ccgctacgtt cgccggctgg tgcggcacaa ggaaacgtcg 28680 
aagcggccgc ctgccatttc agccgacggc gtctatctga tcaccggegg tctcggcgca 2874 0 
ttaggacgaa gggtggcacg ccgcttgatc gagcaaggcg cgcgccgtct ggtactggtc 28800 
ggccggcata cggaggcagt tgccgatctc gagcaactcg gggctgcagt catggttgct 28860 
gcttgcgatg tgagttccga gcaacagctg gcggcgctgc tggcggaccc gcgcacccag 28920 
ccgctgcgtg gagtcgtgca tgccgcaggc gtgctcgatg acggggtagt tacagaacag 28980 
acgtgggctc gtttcgagaa ggtgctggcg ccgaagctgc agggtgcctg gaatcttcac 29040 
cagctcactc gccaccatgc gctcgacttt ttcgtactct tctcttccgc cgcttcgctg 29100 
ctcggttccg ccggacagag caattactcg gcggccaacg catttctcga cagccttgcc 29160 
cacatgcgcc gcgcgcaagg actaccggcg ctgagcatca attggggacc atgggcgggc 29220 
gaaggcatgg ccgcgcgcat cgcgcggcaa ggcctgccgg gggtaccgct gctgccgccg 29280 
gaagtgggtg cgcgcatctt cggcgatctg ctgggcgaga ctgccgctca gatcgcggtg 29340 
ttccaagtct ccgccgaaaa aaggcggagc ccggcgagcg atcccggctt catccagcaa 29400 
ctcaccgaag ctgcgccgga gcggcggcag gaactgctgc agatgcgcat ccgcaagcag 29460 
gccggcggcg tgctggcgct cgatgcgtcc aagacgctcg acccgcgccg gccgctcaag 29520 
gaatacggac tcgattcgct gatggcgctg gatctggcgc gcgccatcgg agagctggtg 29580 
cgcaagagcc ttcccgcgac attgctatac gaccatccga ccgtcgagaa attggccggc 29640 
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catgtcctcc gcgaactcgg actcgacgtc 
cagctgtccg agcaggagat ggcggcgttc 
gaacgatgag cgatctcact cctcttcaac 
cgcgtctcga cgaactggag agcgtccaca 
gccgctttcc cggcgcggac tcgccggaag 
atgccatccg cgaaattcct gcgggccgtt 
ccaacgcgcc gggaaagatg tacacgcgtc 
gcttcgacgc cggcttcttc ggaatcacgc 
agcgcctgct gctcgaggtg gcatgggaag 
gtctcgcggg cagcgacacc ggagtgttca 
tgaaacctac cgatccggcg ctcattgacg 
ctgccgccgg acggatctcc tatctgctgg 
cggcgtgctc ttcctcactc gtggcggttc 
agtgcagcat ggcgctggcc ggcggcgtga 
acttctgccg cctgcgggcc atggcggccg 
ccgacggtta cggccgcggc gagggatgcg 
cgacgcgtga cggcgatcgt attctggcgc 
gccgcagcaa cggcctcacg gcgccgaacg 
cgctcaagaa cgccggcatg gcccccgccg 
ggacgccgct gggagatccc atcgaactgc 
gtgccgtcga ttctccgttg atcgtcgggt 
cggcggcagg tatcgccggc ctgatcaaga 
cgccccatct gcatttcaac gcgcccaacc 
agatagccac cgcatgttcg ccatggccct 
gctcgttcgg aatcagtggc accaattcgc 
tagaagcgaa gacgaatgta gaggcgaaga 
tcaaggcgag tgtagaggcc aaagggaatg 
tcctcgaggg ggacagccgc ccgcgaagcg 
gcgaggaagt gccggtcccg gatcaactcc 
cgctttcggc gcgccatccg caggctctgc 
gctttcacgc tccgctctcc gcgctgtgtt 
aacatcgcgc agcgtttgtg gcctcatccc 
tccggcgcaa tgaaaccaat cgcggcgtcg 
cgaaactcgc cttcatcttt tccggccagg 
tgtattccga cgagcctgtc ttccgatcgg 
gcttcgtgga atggcggctt gcggacctgc 
agatcgatcg cgtgcagcct gcgctgttcg 
aatcctgggg aattcgcccg gacggcgtgg 
cccatgtcgc aggcattctc accctggagg 
ggctgttgct cggacttcgc ggccggggag 
gggcgaaggc cgtgctcgct gaacgcggtc 
gaccacgcag cacggtgttc tcgggagacc 
tcgagaggcg cggcgtcttc tgccggctga 
aggtggaccc gctcgagaac gaattgcgcc 
ccgccgtgcc gttcttctcc acggttgaag 
cgtcgtactg ggtagccaat ctgcgacagc 
tggctggtga tgagttcacg cagttcctgg 
cgatcgagga tagtctgcgg acgctcggca 
gcgacgaacc ggagcggcgt gagctgctcg 
agcgtccgga ctggcgcgcg ctcgcttcgt 



cccagcgatt ccctcgtcga tgaagtgcgg 29700 
atcacggaaa ccttgcacca tctgggagag 29760 
aggcggtcct ggcgctcaag cgcacgcgag 29820 
acgaacccat cgcgatcgtc ggcatggctt 29880 
cattttggca gctcctgcac gatggcatcg 29940 
gggatgccga tgcgttttac gatcccgatc 30000 
tgggcggatt cctcgatggt gccgtcgacg 30060 
cgcgcgaggt cgccggtctg gatccgcagc 30120 
ctttggagcg tgcgggtcgg ccgcccgaca 30180 
tcgggatcag caccgacgac tacagccggc 30240 
cctataccgg taccggaacc gcgttcagca 30300 
ggttgcaggg accgaacttc cccgtcgaca 30360 
atctggcgtg ccgcagcttg cagtcgcgag 30420 
acctgattct ggcgccggaa agcacgatct 30480 
atggccgttg caaaagtttc gctgcctccg 30540 
gaatgctggt gctgaagcgg ctgtccgatg 30600 
tgattcgcgg atcggccgtc aaccacggcg 30660 
gtccggcgca ggaagccgtg attcgggcgg 30720 
atgtcgatta cgtggaagcc cacggaaccg 30780 
gggcgatggc agcggtgctg ggcgaggggc 30840 
cggtgaaaac caacttcggc cacctggagg 30900 
ccattctcgc cctgcagcac cgagagattc 30960 
cgcacgtact ctggaatgag ctgccgctaa 31020 
ccaacggccg cccccgagtt gccggggtga 31080 
acgtcgtcct cgcagaagcg aagacgaatg 31140 
cgaatgtaga ggcgaagacg agtgaagagg 31200 
tggaggctaa ggctagtgct agtgtccccc 31260 
gcggcggggg gtcgggccgg ccgcccagcc 31320 
atgccgaaga cggccgcgaa tacctcctac 31380 
gcgatctcgc cggcgcctat cgcgatgggc 31440 
ccgccgccag cctgacgcgc agtcactacg 31500 
tgcccgagtt caatcaattg ctcgaggcct 31560 
ccaccggttt cgccgatccc ggagttcgtc 31620 
gcggacagta cccgcgcatg gcgtatcgcc 31680 
cgatcgaacg ttgcgacgcc gccttccgca 31740 
tcgccgacga gtcgggagca tggctgagcc 31800 
ccgttcaaat cgcgctggtc gaactgctgc 31860 
ccggacacag catgggagaa gtggcggcgg 31920 
acgcggcccg catcatctgt cgccgcagcc 31980 
cgatggctct ggtcgaactg ccgctcgatc 32040 
tcactactgt ttctgtcgcg gccagcaacg 32100 
gtgtggctct cgagcatttg aaggacgact 32160 
ttcaggtgga tgtcgcttca cacagctcgc 32220 
aggaactcgg ccgcgttatt gcaaaacgtt 32280 
gacagttgag cacgggcgag gcgtgcgacg 32340 
cagtccgttt ctgggagtcg ttgcaggcga 32400 
agatcagtcc gcatcctgtg ctgacgccgt 32460 
taaacggact ggttcgcccc gtactgcgcc 32520 
agttgctcgc cgcgctctac gtgaatgggc 32580 
ctcccgacac gcgcctggat ctgccgacgt 32640 
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atccctggca gcgcgagcgc ttctggttcg cgacctcgac gcggcgaagt ttgccggcag 32700 
ttggcggtca tccgctgctc ggtcgcaagg tcgagattgc gctggcgccg gacacacacg 32760 
tctgggagtc cgtgctctct ctggatgcgc tgccgtttct cgccgatcac cggctcaacg 32820 
agcttgtggt gcttcccggt gccgcttatg tggagatggc gctggccgca gccaaggaag 32880 
tgttcgcggg tggctgcagc ctggaagaga tccggtttga acaaatgctg gttgttcctt 32940 
ccgcgggcgc ctcgcgagtg caggtcatac tcgagggaca cgcattccgc atctccagtc 33000 
tggccgaagg cggttccgat tggaccgagc acgcgcgcgg caccatggct gcggcgccgg 33060 
acaaggtcgc gcccacggtg agcctgccca cacttgggga tcgcatcgag ggcgatgact 33120 
tctatgcggc cttcgcatcg ca^gggatgc attacggcga caccttccgc ggcatcgcgg 33180 
aagtgtggcg gcgcgacggc gaggcagtgg cgcgactgag cgtgccggat gccgttcgcg 33240 
aagcagagtc cggttacacg cttcatcctg ccttgctcga tgcctgtttg caggtgctgg 33300 
gcgcgacgct tggcggcgaa ggcagcgccg gtccttgcgt gcctgtcgcc atcgaacggt 33360 
tgcactgttt cggcagaccc gccggcgatc ttagggtgca tgcgcggctg acggggcggc 33420 
tcgagggcga tgtcaccctg tgtgatgcgg aaggccacgt catcctcgag gtccaaggcc 33480 
tgcgtgccca ggaactggag cgccaatccg aatggttcca cgctatggaa tgggagccgc 33540 
agctgctggc cgagagtcca acggcaacgg tgtcgggtgc atggctggtc attgccgatg 33600 
ccggcggcat cgcagccgcg gtggcgcgag ggctgggcac aaacacggtt gtgatttcgg 33660 
gtcgcgatgc cgagataccg gatcagcctt accggggcgt cattcactgc gggagcctgg 33720 
atgagaccga ggatgagacc gatccgtcgg ctgcgggggg aaccgcctgc gaagacattt 33780 
tgcgcatcgt tcaagaattc ggagtgggac gcatacagct gacgaaacaa gcgtccgacg 33 840 
ccgaatcgca gcatccgcga atctggctga ttacggcggg cgttcatgcg gagcatctgc 33900 
agatgccggt ggtgcccgcg cgggcaccgg tgtggggtct gggacgtacc atcgcggccg 33960 
agcatcccga gttcgcttgc acctgcatcg atctcgacac tgccggtgaa gtcgaggtgc 34020 
aggcgctctg ccgagagatt ctcgcgggga gttctgaacg tcagggcccg g 34071 



<210> 115 
<211> 4615 
<212> ADN . 
<213> bacterie 

<400> 115 

actgcagtgc ccggaatcgg cggtggactt acagcagccg ctggtgcgta tgggattgga 60 
ctcgctcatg gcggtgcaat tacgcaaccg gatcgatacg gatctgcgcg tcttgctgcc 120 
catggtccga tttctagacg gccccagcgt tgcggaactg gccagggatc taagcgatct 180 
aagcggcctc agcgaacgca cgacggtggc gccggaacct gcggcgcagg cctcggttcc 240 
tgccctctcc taccctctca gcgccggcca gcaggcgctt tggtttattt accgaagcgc 300 
gccggaaagt cccgcataca acatcgcgtg gatcgcgcgc gcgagaggcg ctttcgatcc 360 
gcaggcgttg cgccgttcgc tgcaggacct ggtggatcgt catccggcgc tgcgaacgac 420 
gattgcggag agtggcggcg cacccgttca aacggtccac agcagcgtcc cggtggattt 480 
cgaagtgatc ccgtgttcgc cggacgatga ggcggtgctg atcgacggcg tcttccacgc 540 
gcccttcaat ctcggcgaaa actgtttccg ctcgcgtctc ctggtgcagt cggggaagga 600 
tcaggttctg gccatcgtgg tgcatcacat cctcgccgac ttctggtcac tgctggtgat 660 
ggtggatgaa ctccgcagta tctacctcgc gaggacagct g^gcggtccgc ctgtcgcgcc 720 
gccggtcgcg agcttcgccg ctttcgtccg ctggcagaac gaactgttgg ccggaaccga 780 
gggcgagcgg ctttggaact actggtcctc gcagctttcc ggccagcttc cggttctgaa 840 
tctcccgtcg gatcgtccca gtccgccggt gcagagtttc cggggaaact ctcactcgtt 900 
ccgaatcgaa cccgcgctga ctgcgaaact gaaggcgctc gcgcggcggc agaacgcgac 960 
gctgcatgcg acgctgatgg cggcgtttca agtgcttctc tcccgttgga cctcacaaga 1020 
agagabcctg accggcaccc tcaccaacgg tcggacgcaa ccggaattcg ccgatctcgt 1080 
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cggatacttc gtgaatcccg taatcctgcg aggagaactt tcaggcgatc cggatttcaa 1140 
tacggtgctc gcccggattc ggcaaacgct tctcggcgcg atcgagcacc aggagtaccc 1200 
gtatgcccgg atcgtggagc ggttgggtcc cggactgcgg gttctattcg tgctccagca 1260 
gcctcatcgc attcccgaat ccgtgccgtt catgttgggt cagtccggcg gtcgcatggc 1320 
ctggggcagc ctcacactgg agtccctggc gatgccgctg cgacagagcc ggtttgacct 1380 
ggatctgatg atggtcgaaa ccgatggagg cctctccgcc tttctgcaat acaacacgga 1440 
catttttgat gctgccacga ttgaacgtct ctccttgcac ttcgccgtgc tgctggaagg 1500 
aatcgcggag aatcccgcct gtccagttgt cgatctaccg ctgctgacaa cccgggaacg 1560 
catccagctg ctcgaagagt ggaatgcgac cgccgcggaa ttcccgtccc aatgcgtgca 1620 
cgagctgttc gaagctcagg tggagttgac gcccgacgcc atcgcgttga gcttcggtga 1680 
gcagaatctg acatatcgcg aactcaacgg gagcgccaac cggatcgcgc actatctccg 1740 
ctcgcgcggc gctggacccg gcgaaatggt tggcatccat gtcacgcggt cgctcgaaac 1800 
cgtcgcaggg ctgttgggcg tcctgaaggc cggcgcggcc tacgttccgc tggaaccgga 1860 
atatccggcg caacgtcttc ggctgatgct ggaagagacc aggccggtcg ttgtgctgaa 1920 
tgtcacggaa tcggaagtat ggacgcagcc cgacaccaat ccgaacccgc tcgcgactcc 1980 
cgccgatctc gcctatgtcc tgtacacctc cggttcgacc ggccggccga aaggcgtgca 2040 
aatcacacac caggccgtcg tcaattttct ttcgtcgatg cggcatgagc cgggcatcag 2100 
cgaccgcgat acgctgctcg ccctcacgac gttcatgttc gacatttccg cgctcgagat 2160 
ctttttgccc ttgagcgccg gcgcgcgcgt cgtggtggcg aaccaggaga cggccgtcga 2220 
tggtgagagg ctggcgaggg aactcgcgcg cagcaaagcg acaatgatgc aggcaactcc 2280 
cgccacctgg cgtctgctgc tcgcatccgg ctggcccggc gaccgccgcc tgacggcgct 2340 
ctgcggcggt gaagcccttc ctcgcgatct tgccgaccgg ctcctgcaac gaaccgcggc 2400 
gctatggaat ctttacggac ctaccgaaac gacaatttgg tccgccatcc aacgggtgac 2460 
gacaggtgac ggaccggttt cgattggccg ccccatcgca aacactcagc tctatgtgct 2520 
tgacgatcgg atgcagcccg cacccatcgg tgttgcgggc gaactgtaca tcggcggcgc 2580 
cgggctcgcc cgtggatacc tgaatcgtcc ggaactcagc gcggacaagt tcgtcgccaa 2640 
ttcgttcgac cctcatggca ctcggctgta tcgcacggga gatctcgccc gccgccaacg 2700 
cgacggcgcg ctcgagtatc tcggccggat cgaccaccag gtgaagatac gcgggttccg 2760 
catcgaaacc ggcgagatcg aggccgcggt ccgcagtcac ccggcggtcc gacatgctgt 2820 
ggtcaccgcc agagaaaatg acgcggccgg taagtatctg gcggcctaca ttgtccccct 2880 
tgctgacggg catcgcgcga cggcagccgc cgacacattc cacgaccgag tcgagtccga 2940 
gcacgtgacg cagtggcaat ccgtctggga caccacatat gaacagaatg cgccgaacgc 3000 
ggatccggag ttcaacatcg tcggctggag aagcagtgtt accggagagc cgattccagc 3060 
tgccgagatg cgggagtggg tgcaggattc cgtcgatcgc atcctggcct cgcggccgcg 3120 
tcgcgtgctc gagattggct gtggtacggg actgctgctc ttccgcgtcg ctccccactg 3180 
ttcggagtac tgggccacgg acttttcgca gaaggcgctg gactacatcg ccgctcacgc 3240 
ggaccgcacc ggcctggcaa atgtccgcac gttccggcag gcggccgacg acgcgtgcga 3300 
gatcgacagt cgctcgtgcg atgcggttgt tctgaactcc gttatccagt acttccccgg 3360 
cgaagcgtat ctgcggcgcg tgctggccga ggcggtgcgt gtggtcaaac cgggcggcat 3420 
cgtatttgtc ggcgatgtcc gcagtctccc gctgctggag acgttttacg cttctttaga 3480 
agttcagcgc gcacccgcgt cgttgacccg gaatgagttt cggcaacgcg tgcgttcgct 3540 
cgcgtcgcag gaagaggaac tcgtggtcga tcccgcgttc ttctttgctc tccgcgaaca 3600 
gattccggag atcggccgga ttgaaatcct gccgcgtcgc ggccggtcgc ataacgagct 3660 
gacccgcttc cgctaccagg cgatcctgca tatcggatcg cgggaagcgg aggagccgga 3720 
atcggatcgc aggcgttgcc agaccgcggc cgaaatacgc agagtactga cggacgctca 3780 
gccggagttg gccgcattta ccgagattcc gaacgcacgg ttgaccgccg aaagcgccat 3840 
tgtgacctgg atgaacggtg acgaagctcc agagacactc ggggagttgc gggaccggct 3900 
gcgccagacg tcgccttccg gcgtcgatcc cgccgatcta tggcgtatgg acgaagacct 3960 
gccgtaccgc gtggcaatcg actggagcag tcatgggcca cacggacgct tcgacgcgac 4020 
cttctgccgt gcggcggccg gtccgccggc ttcccgtccg cgacgccgcc tggccggccc 4080 
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gtatacgaac gatccgctgc gagccgtcta tacgcgcacg gttgtgccgc agttgcgtac 4140 
tcatctgaag gagaagctgc ccgactacat gatcccgacc gcgtgggtcg tgctccacga 4200 
aatgccgctg acgcccaacg gaaaaatcga ccgtaacgcc ctgcccgatc ccgagcccag 4260 
ccggcgagcc cacgccgaag cattcacgcc tccggaaact ccggtggaac aggtactcgc 4320 
ccacatttgg ggcgaggtgc tcggcatgga tggcatcggc gtccatgatc acttcttcga 4380 
ctctggagga cattcgctgc tggtcacgca gatgatcgcc cgcgtgcgcg acatgctcca 4440 
cgtggaagtg ccctttcgaa ccgtgtttaa cgcccccacg gttcgaggct tcgccgtcgc 4500 
tattcaggac ggcgtagacc caggatgggc aaggcgagcc gccgatttgc tgatcgctgt 4560 
ttcccaaatg tcagatgttc aaatcgagcg tatgatgagc gccgcccaag actag 4615 



<210> 116 
<211> 8301 
<212> ADN 
<213> bacteria 

<400> 116 

atgcagaatt cgtcgccaaa taccatagac ctctcgctcg cccgccgcca attgctcgac 60 
cgtctgctgc aggaaaacag ccccgaacat cgcatcccgc ggcgtgaaaa ccgggatgcc 120 
gcacccttgt cgctggccca gcagcggctt tggtttctcc atcagctcga cccggattct 180 
cccgcctaca acattcccat agcgctgcat atccgaggtc cgctggatat tcgcgtcctc 240 
ctgcggagtc tggaggccgt ggtgcagcgg cacgagagcc tgcgcagctg cattggcggt 300 
gtggatggag aggcgcgcca gagcctcctg gcgcgagtga cactggaact tccggttgtt 360 
caggctgacg gaatcgcaga agcgcggcaa atggccttgc gtgatgccca gatcccgttc 420 
gacctgcgaa aacccccgct tctgcggacc aagctgatct gcctcgatga caagcagcag 480 
attctcctgc tgacgttgag ccacatcatc gcggatgcgt ggtcggtcga gacgttcgtc 540 
cgcgacctga cgcgatcgta cgaagcgttc gtgcaggggc ggccatcgcc gctcatggaa 600 
ctgccgattc agtatggcga ctgggccgtc catcagcaga cgtcgctgaa ccaaaccgcg 660 
cagcagtact ggaagaaaca gctgtcgggc accttgcctt tcctcgacct tcctaccgat 720 
cgcccccggc ccgcgcagca gacctggcgg ggcgccgtgg agaccacagc cctcggccgt 780 
gatttgaccg atggactcca cgcgtttgcc ttgcgtgaag gagcgacggt gttcatgacg 840 
gcaatcgcgg cgtttcaggt gctgctgcat cgctataccg cgcaggaaga catccttatc 900 
ggggttccag tcgcgggccg tacacaacga gaaacggaag gtctcgtcgg ttgtttcgcc 960 
aacatgatcg tcctgcgcgg cgatctgcgc gacgatccgt cgtttcgcag tcttctcgcc 1020 
cgcacccgcg acaccgcttt gagcgccctc tctcatcagg actttccttt cgaacgcctg 1080 
gttgaggaac tgcatcctcc gcgggacctg agccggtcgc ctgtatttca ggtctccttc 1140 
gcgctgctgc ccgatgcgcc ggccatcacc gtcatgcctg ggctcaccat ctcgcgcgag 1200 
tacatgcaca acggcggatc caaactcgac ctcggcgtga ccctcgagcc atccggcgat 1260 
ggactgatgg cgtccgccga atacaacacc gatttgttcg atgcggcaac catcgcctcc 1320 
ctgctcgatg cgtaccgaac cctgctggcg agcgtggtga cggatcccga cgtccgcatt 1380 
tcaaccgctg cgctgttgtc ccccgcggtc cgaagccgga tgctcgagca gcacaatgcg 1440 
acacggcgcg atgccggtcc gaacgggtgt gcgcatgaac tggtcgaagc tcaggcggaa 1500 
cgcactccgc acgccgtcgc cgttgtcttc gaagaccatc agttgaccta cgccgagctg 1560 
aatgcgcggg ccaaccgcct ggctcatcgt ctgagcgcat ccggcgcggg cccgggaaag 1620 
atcatcgctc tggcgatgga gcgctcgctg gagatggtga ttgcgctgct tgcgattctg 1680 
aagtccggca gcgcgtacct gcctctcgat cccgcgcacc ccaaggatcg tctcgcccgg 1740 
attctcgatg aagtgcaacc gcacgcggtc ctcacgcagg aggcggtggc tgagatgatg 1800 
gcgatgatgg cgatgatggc ggtcgccgtc gaaccagaag ctgcgaatct cgtcagcggc 1860 
agcaagcccg acgatctcgc ctacatcata tatacctccg gatcgacggg gcgaccgaag 1920 
ggcgtggaga tccgccactc gtcgctagtc aatctgctgc gctccatgca gcgcgagccg 1980 
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ggtctgacag ccgccgatgg gctggtcgcc gtcaccaccg tgtcattcga tattgccgga 2040 
ctggagatct ggctgccgtt gatcaccggc gcccgcgtca tcgtcgccac ccgcgagatc 2100 
gtggttgacg gcgagcggct caccaccctg ctggataagt cgggcgctac ggtcatgcag 2160 
gcgaccccga gcggttggcg gcaattgctg gattcgggct ggaagccggg taaaggcttc 2220 
cgtgttttct gcggcggtga agctctgccg ccggaactgg cgcgccgcat tctcgatagt 2280 
ggcgtagagc tgtggaatct ttacggaccg acggagacca ccatatggtc ggccgtgcac 2340 
aagacacaaa gactgggtgc ctccgatagc atcgtgccga tcggccatcc catcgacaac 2400 
acgcagttat acatcctgga ttcgcgcatg gagccggttc cccccggagt tccgggagag 2460 
ctgtacatcg gaggagcggg actggcgcgg ggctatcatc gcaaccccga gctcacgcgt 2520 
gagaaattcc gcgagtggcg tgatcgagga cgcatttact ctaccggcga tctggctcgc 2580 
taccgttccg acggcgcagt cgagtgcctg ggacgagtcg atcgccagat caagctgcgc 2640 
gggtttcgca tcgaaccggc cgagattgag gccgcgatcg agacgcacat tgccgtgaag 2700 
caggcgatta cggtcgtgaa ggacgatcgg ctgatcgcct atctcgttcc ggcaacgggc 2760 
gacgtgcgcg atctgcagag cgatttgcgg tcgtggctgg caacgcgcct tcccgattac 2820 
atgatcccct cggcgtttgt cagcctgtcc tcccttccgc tgacgcccaa cggcaaaatc 2880 
gacgcgaacg cgcttcccgg tttgcccaca acgccggttg ctgctcgcga gccgatgcgc 2940 
ggcgatgtgg tggagacgat tgcgtccatc tggcgtgaag ttctgcgcgt ggagcacgtc 3000 
gactatcggc agaacttctt tgatgtcggc gggcactcgc taatgctcac acgggtgcgc 3060 
ggactgctcg aggagcgcct ggggttgacg ctctccgtcg tcgatctgtt ccggcatacg 3120 
acgatcgagt cgcttgccgg cctggcagaa aaatccgaac ccgccgctgc ggaacctgcg 3180 
gctgcggtcg cagaagatcg gatcgcagtt atcgggatgg ccggccggtt cccgggggcg 3240 
cgcaatgtgg aggagttctg gcgcaatctg cgcgacggtg tggattccat cgccaggctt 3300 
tcgccggaag atctgctggc gggcggcatc agcccggagg tcttccagga cccgagctac 3360 
gtgccggcca agggtctgct ggacggcatc gagtttttcg atgccgcgtt cttcggctac 3420 
agtccgcgcg aagcggagat catggacccg cagcatcgcg tgtttctcga gtgcgcgtgg 3480 
gaagcgatgg agaacgcggg atatgcggcg cgaagctata agggttcgat cggcgttttc 3540 
gcgggatgcg gcgtcaatac ctacctgctg aacaacctcg ccaccgcgga gccgttcgat 3600 
ttctcacgcc cctccgcgta ccagctgctg acggccaacg acaaggattt cctggccacg 3660 
cgtgtctctt acaagctgaa cctccgcggg cccagcctga cggttcagac ggcgtgctcc 3720 
acctcgctgg tgtcggtggt gatggcatgc gagagcttgc agcgcggcgc ctcggacatt 3780 
gccttggccg ggggagttgc catcaatgtt ccgcagtccg tggggtacct gcaccagccg 3840 
ggcatgatcc tgtcgcccga cgggcgctgc cgcgccttcg atgagtccgc tcaaggcacg 3900 
gtgccgggca acggcgcggg tgtggtcgtc ctcaagcgct tgagccgcgc tctggccgat 3960 
ggcgacacga tctacgccgt cattcgcgga gcggctatta ataatgatgg cgccgagcgc 4020 
atggggttta ccgctccagg tgtggacggt cagacgcgat tgattcggcg cactcaagag 4080 
atggcgggcg tgaagccgga gtccatcggc tacatcgagg cccacggaac agccacgccg 4140 
ctcggcgatc cggtggagat cgccgccatc gctgccaact ttccgaaaaa cggaagcggc 4200 
gatgtgtata tcggatccgt caagaccaac atcggtcatc tagacgtcgc ggccggtgtg 4260 
gccgggctga tcaagacggt gcttgccgtc catcgcggcc agattcctcc cagcctgaat 4320 
ttccagcgtc cgaatccgcg aattgatttc gcaaacactc cgtttcgtgt gagtacgcgg 4380 
ctgctcgact ggcccgccgg aaagaccccg agacgagcgg cagtcagttc gttcgggatc 4440 
ggcggcacca acgctcacgt gattctggag caagcgccgc cggtgacgcc ggccgcagct 4500 
gcgcccgaac gatccgcaca tgtgctttgc ctgtccgcca atacagacgc ggccctcgaa 4560 
gaactggtgc gctcgtatcg cggccatatg gacaaccagc ccggtttgtc gttcggcgat 4620 
gtcgcattca cggccaatgc agggcgcgtg cacttcccgc accgtatctg cattgtggcc 4680 
cggtcgagcg acgaggctcg ccaacgactg acggaggcac gacgggttcg catcgcccag 4740 
acgcgcccca agattgcgtt tcttttcacc gggcaaggtg cgcaatacgc gggcatgggc 4800 
cgccagttct acgagtcgca gccggtgttt cgcgccgcca tggatgaatg cgcagctctg 4860 
ctgaatggac ggctcgatct gccggcgctg ttggccgatg acgcgttgct cgacgcgacc 4920 
gccggcgcgc agcccgcgct gtttgctttg cagtgggcct tggcgcagtt gtggaagtcc 4980 
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tggggtgtga cgcccgacct ggtgatggga cacagcgtcg gcgaatacgc ggcggcgtgt 5040 
attgccggcg ccgtcagcct gccggatgcg ctcggcttag ttgccgaacg cggccggctc 5100 
atgcagaacc tgccggaagg tgcgatggct gcggtcagcg ccggcgagca gcgctgtgcc 5160 
gcagcgatca cctcgcgcgt ctccattgcg gccatcaacg gacccgctga ggtcgtgatt 5220 
tcgggtgcgc cgcaggatat tgagagcgcg ctggcaactc tacgtgcgga gggcatcaaa 5280 
acgcagatgc tggccgttgc gcgcgccttt cacagctcga gcatggatcc gattctggcg 5340 
gacctgcaac gccgggcggc ggcgatcgcg tggcgcaatc cttcgatcgg cttggtttcg 5400 
aacctcacgg gcaaactggc cggcgaggga cagctggcga atccgctgta ctggcgagat 5460 
cacgctcgaa accctgtccg tttcgccgac ggtatccaaa cgctcaagga cgaaggctgc 5520 
gacgtgtttc tcgagatcgg tcctaagccg gttctactcg gcatgggcca aaagtgcctg 5580 
cccgacgacg ccaagcagtg gctgccgtcg ctgcgtaaag gccgcgatga gtgggagacg 5640 
attctcagca gtgtggcgac gctatatcag ggtgggttcg acatcgattg gcaggagttc 5700 
gaccgtccgt attcgcgaag gcgtgtcgcc ctgccggcct atcctttcga gagacgccgc 5760 
cattggatcg agcggagttc cagaccggaa cctgtagcgg ttgcgagtgg tctcgtcggg 5820 
tgccggctgt cgctaccggt ggcagacgtt atcttcgagt cgaaactatc gacggcttcg 5880 
cctctactct cagaccaccg atattacggt tcggtggtgg ccccggccgt gtacttcctg 5940 
gccatggcgc tcgaggcgtc ggcggaggtg tttggcgccg gccggcacac gctggaaaac 6000 
gtgaacttcg cgcaccctct gatcctttca gcggagcgcg acacggctgt tcagctcgtg 6060 
ctttcacaga gcgatgaccg gcatgcctcg ttccgcatac tcagcttgtc cgacggctcg 6120 
tggaacttac atgctgccgg caatattgcc gcccacgctg gtgtcgctcc cgtgccccga 6180 
ctggtcgatg aacgccggcc tgcggtggat ggagacacgt actattcgct gctgcgccac 6240 
ctcgagatag aactggggcc gagctaccgc cgcatacagc gcattcattt cggtgaacag 6300 
gaagcgctgg ccgcgattga ttccgcaacg ccgctcaatc cccgttgtga attggcggaa 6360 
gccggcctgc aattgcttag cgccgcggcg agtcccgcgc ttgcggatgg cgccgaacat 6420 
ccgatattcg ctccgctcgg tatcgatcgc gtttgttttt acggcagcct ggagggcgcc 6480 
gtatgggggg ccgcgcaaat tctccggcat tcgccggacg gctttaccgg cgaggcgcag 6540 
ttgctggact cggagggctg cgttctcggg gaacttcagg gcgtgagttt ccggcgcgtc 6600 
actcgcgcat gggcgcagcg ctcggaacgg aagcccgaat tgtatgaggt cgagtggcgg 6660 
cccgaaccgc tccgccagcc ttcgcgaacg ctacagcctg gggcatggct gatcctggcc 6720 
gacagtggcg gcgcggcccg cgctctggca gatgcgctca cagctcaggg cgagatgtgc 6780 
gttaccgtgc cgccagccgg cgagtacatg tccctagtcg gtgagcgtga ctggcgcggg 6840 
atcgtcaacc tgtacagtct cgatgattat gagctcggct gccgcagcac tctggccctg 6900 
gtgaagtccc tgaagtccgg tccgcggcta tggctggtaa cggccggcgc gcaggcgacc 6960 
agtgcggtgc acaatcccat gcaggccgcg ctctggggct tcggccgggf gatcgcgcgc 7020 
gagcacccgg atctgtgggg cgggctcatc gatctggatc ccgacgatgc gcatgcttcg 7080 
gcggccggcg cggccgcgca gatgcgtgat ttcgacggcg aagatcagtc ggcgtggaga 7140 
agcaaccggc gctacgtgcc gcgactgacc cgccgaccca gcgcgcgagc ggcagtccgt 7200 
ctggtttcgg gcgcgactta tttgatcacc ggcgggctcg gagccctggg acttacagtc 7260 
gcgaaatgga tggtggagca cggcgccact cgcgtcgtgc tggccgggcg ccggcctcca 7320 
aacgaggagc agcagcgcgt gctgcaacag attggtgcga cggcagagac ggtcgacgtc 7380 
agccgggaag aagaggtcgc ggatctcatt cgccgcatcc acaccgaaac gtcaccgctg 7440 
cgcggcgtta tccatgccgc gggtgtgctg gacgacggcg tactgctgaa tcaggactgg 7500 
acgcggatcg caagcgtcat ggcgccgaag gcggaaggcg ctgtacacct ccatcatcac 7560 
acccgcgatc tgccgctcga cttcttcgtg ctcttttcat cggcatcctc gctcttaggt 7620 
cctgccgggc aggcaggcta cgccgcggcc aacgccgttc tcgatgcgct ggcgcatcac 7680 
cggcgcggac tgggtttgcc ggcgaccagc attaactggg ggcgctggtc gggagccgga 7740 
atggccgcgc gcaccagcca gtcgatggcc ggcgtggcga gcctctccgt ggacgagggt 7800 
ctacacattc tcgaggccgt cctgcatgaa tgccccattc agattgccgc gctaccggcg 7860 
ggctcgatta ccggcgagtt gctgcgtccc gccgcgctgc cttcacctca actgcgcacc 7920 
cgcttgaacg aagccacacc ccggcagcgc gaagccatcc tcattgcgca catcagggag 7980 
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tcactggcgc gctttgtcgg catcgcgact 
ggtgaactgg gactcgattc gctaatggcc 
ctggggcagc ctttgcccgc gagtctgctg 
agttacgtgc tccatgcggt atttccaccc 
gagaacctcg cccgcgaaga actggaagcg 
cagtggttgg agacgcaata a 



tccacaccgc tcgatccaca gcagcctttg 8040 
atagaacttc gcaactcgct ctcccaatca 8100 
ttcgactatc cgtcgctcga tgcgatcgtc 8160 
gaagcatcac cggtggaagc gccggagttt 8220 
ctgctcgatt cgcggctggc gcaggtcgac 8280 
8301 



<210> 117 
<211> 5292 
<212> ADN 
<213> bacteria 

<400> 117 

atgagcgggt cagacgatct cagcaagctt 
cagaaacgca tcgaccagct ggagagcgcg 
ggctgccgct tccccggcgc atccaatctc 
cgcagcgcgg tacgtgaagt tccacccgac 
gatcccggcg cgacgggccg aatgtacacg 
cgttttgacg cccggttctt cggcatcgct 
cagcggctgc ttctggaagt cacctgggag 
cggctggcgg ggagccggac cggcgtcttc 
ctgcaaatgc gcggcgggga tgcgcatatc 
agcgttgccg ccgggcgtct ctcgtacatc 
gacacggcat gctcgtcatc gctggtcgcg 
ggtgaaagcg acctcgcgct ggcgggcggc 
atctacttct gcaagctgaa ggcgatggca 
gcagcagacg gctacgtccg cggtgagggc 
gacgcgctgc gcgatcgcga tccggtgatg 
gacggacgca gcaatggact gacggcgccg 
caggctgtgg gagacgcgcg cttgcagacg 
accggcacgc cgctgggcga tcccatcgaa 
gggcgcacca acggcaacaa gctgaagctc 
gaggcggcag cgggcgtggc cgcactgatc 
attccgcccc atctgaatct gaccacgccc 
ctcgaaatcc cggcacggct caccccctgg 
ggcatcaact cgttcggctt gagcggtacg 
caacaggccg cgtccagtac gcccgcaccg 
gaggcgctgc gtgatctggc gcgcgcatac 
acctgctaca cggcgtgcgc tcgccgcact 
acgaacgcgc aggacttgat ggccgggctg 
gataccgcca caggttttgt gccgcgcggc 
ggacaaggat cgcagtggcc cggcatgggc 
cgtgccgcca tcgaagagtg cggccgcgcc 
caagagttgc aggggccgct cgaccgcatc 
ggggtcgcct tggccggact gtggcgccat 
cacagcatgg gcgaagtcgc ggcagcgcac 
gctcgggtga tttgcctgcg cagccggatg 
gctgtcgtgg aattagcgct ggacgaggcc 
gtctcgattg ccgccagcaa cagcccgcgc 



cgccgcgccg tgattgcgct cgacaaggtg 60 
cgcagcgagc ccatcgccct catcggcgcg 120 
gatgcctatt ggtcgttgct gcgcgagggc 180 
cgctgggaca tcgatgccta ctacgatccg 240 
cggtacggcg gcttcatcga tcaggttgac 300 
ccgcgcgagg cgatcagcct ggatccacag 360 
gcgatcgaga acgccgggct tccacccgac 420 
atggggatct tttccaacga ttattacaac 480 
gacgcgtaca ccggcacggg caatacggcc 540 
ctcgggctgc agggcccgaa catggcgatc 600 
gtgcaccttg cctgtcagag cctgcgctca 660 
gtcaatctga ttctctcgcc ggatcggacg 720 
gccgacggtc gctgtaaggc attcgatgcc 780 
tgcggtgtgg ttgtgctgaa gcgactctcc 840 
gcggtgattc gcggcacggc aatcaaccag 900 
aacgggcccg cacaggaagc cgtgatccgc 960 
ctggatgtga gctatgtcga ggcgcacgga 1020 
gccggagccc ttgcggccgc gctgggagcg 1080 
gggtcggtga agaccaactt cggccacctc 1140 
aaggtggcgc tgatgctgca gaacgaagcc 1200 
agcccgcaca tcgattggaa cacgcttccc 1260 
ccggttgcac ccggcgggcg gcgcgtcgcc 1320 
aatgcgcacg tgctcatcga gcaggcgccg 1380 
tacctgcttc cgctatcggc gcgcagtccg 1440 
cgcgacgtgg tgaacgacaa ccccgccgac 1500 
tcatacgaac accgcgcggc attcaccggg 1560 
gacagttttc tggcgggcaa cccgaaccgc 1620 
cagaagcgaa aagtcgtttt cgttttgccg 1680 
cgcgacctga tggcttctga accggtgttc 1740 
atgcagcctt acgtcgactg gtcgctgacg 1800 
gacgtgattc aaccggccct gttcgcagtc 1860 
t9999aatcg agccggacgc cgtgatcggc 1920 
attgcaggtg cgctgactct cgatgaagcc 1980 
ctcgccggag tacgcggcca gggagaaatg 2040 
atcgctgcca tcgccgggcg ctcggatcgg 2100 
agcaccgtcc tgtcgggcga cagcgcagct 2160 
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ctgggcgaac tgctgcggga actggaggcg aaagacgtct tctgccgtcg cgtgaaagtg 2220 
gacattgcct cgcacagcca tctgatggac tccgtgtgcg cggcgttgcc gggcgtggtg 2280 
ggagcgcttc agccgcggcc ggccgccctt ggcatgtact ccaccgtcac cggcgcagcg 2340 
attagcggtg aagagctggt ttctgcgtac tgggctcgta atcttcgcca acccgtgatg 2400 
ctgtcgacgg ccgtcgccgc agccgcggcg ggtggtcatg atgtgtttct ggaactgagt 2460 
ccccacccgt tgttggtcca gccgatccag gaaacgctcg gagatcgggc agcgattgcc 2520 
gctgcctcgt tgcggcgcga tgaagacgga aacctcgcac tgcgccggac gctgggagcg 2580 
ctgctgacta acggagtcac tccggactgg tctcgtattt atcccaacgg cggccaaact 2640 
cgccggctgc ccaactatcc ctggcagcgt gagcgttatt ggatcgatat ccgtccgccg 2700 
caggtcgagt ctcaggcttt gcctggccgg cggatcccgt cgccgctgcc ggagatgcag 2760 
ttcgagtcca ctgtggaggc gaaagatttc gcggatcacc ggctgcacga tgtgatcgtg 2820 
actccgggag cgtggcacct ggcaatggcg ctcgccgctg cgcgccaagg tctcggcgcc 2880 
gggcctcacc atgtcgaaca cgtgtcattg acgggcgcgc tgacgctgcc ggaaaacgat 2940 
gctgccaggc aggttcaact ggtactccgt catgaagagg gcggcggagc ttccttccgc 3000 
atctacagcc gcgaggattc ctggaagctg cacagcgaag gcatgctgca ggcgggcgat 3060 
tccacggcat ccatcgatct ggatgcgatt cgcgcccgct gcacggcgga gctcacagcc 3120 
gatgccttct attcgcgact gtgggatcgc ggctatcact tcggtcccac cttccgaacc 3180 
atcggcccca tctggcgcgg caacggtgag gtgctttgtc gcgtggacat tccgctgacg 3240 
gaaatgcaga cgatcgactg ctgtctgcag ttgcccgcgg ccctcgtcca tcacgacgat 3300 
ttgaaagatg tgcatgtgcc ggtaggtctg gaccgattct cgctcgctga agtgcccact 3360 
ggcccggtct ggggatacgc ggtcttgcgg ccggattcca cggtggatgt ccgtctcgtc 3420 
accggcaccg gcagcgtggt ggcggaattg gtggggctgc agtcgagagt cgcccatagc 3480 
ggccagctcg gcgaatcgga gattcccacc tggacggtgc aatggaccgc gtcggttcgc 3540 
cgcggcgatg ccaatgccgg caatgctggc ggaccttggc tcgtcatcgg cgagccggcg 3600 
attgccgaga ctctgcaaaa gcgcggccaa acctgccgca cggccgatac gtgctcgggt 3660 
ccgccgtgcc gtcaaattgt gtactgtccc tcgccgcgca tcgacgacct gctttccgta 3720 
ttgcgcagca tcgtgcaagc gggctggcct gagccgccgc gcctgtggct gctgacgcgc 3780 
ggatctgccg cggttctcaa ctccgacaaa gatattgata ttcgacaagc ctggctgcac 3840 
ggaattgggc ggacgattgc ctatgagcat cccgagctgc gctgcacgct cgtcgatctc 3900 
gatgcgcaca gcaacgactg cgggcatctc gcgacgctga tgctgtcgaa tatcgcagag 3960 
gatcaagttg cgatccggca aggcacggta tgggcgccgc gcctcagtct tcacaagatc 4020 
ccatccgcac ccgatgtggc gttccgtgcc gacgcaacct atctgatcac gggcgggctc 4080 
ggcggactcg gactgcaggt ggcgggatgg ctcgccgccg ccggagcgcg ccatctcgtt 4140 
ctgctgggac gcagcgagcg tcctcggcca caactggaag gtgtcaacgt caagatcatc 4200 
catgcggacg tggcggaccg gcagcagcta tcggatgcgc tcgcgatcat cgatcgcgac 4260 
atgccgccgt tgcggggcgt gttccatctg gcaggcacgc tggccgacgg catgctgctc 4320 
aatctcacga ccgaacgctt cgaagccgcc atggctccga aagtagccgg cgcgtggaac 4380 
ctgcacgaac tcaccgccgg ccggccgctg gatcattttg ttctcttctc ttccgccagc 4440 
gcgacagtgg gatctcccgg ccagggcaac tacgccgccg gcaattcatt tctcgacgcg 4500 
ctggctcatc tgcgccgcgc ccagggtctt cccgccgtca gcatcgcgtg gggaccgtgg 4560 
acacaggttg gtttggccgc acaggcgaac cgcggagacc gtctggccgc gcgcggcatc 4620 
tcggttattc aaccgcaaca gggattgcgc gcgctctaca aagcattgac gcagattcgg 4680 
ccgcacgtcg ctgtcatgaa cttcgatatc gcgcagtggc tccgttacta tccgtcggcc 4740 
gcatcgatgt ccctgctggc cggcatcgca cccgcggccg cggacaccaa accggcggcc 4800 
gacatgcgca gcgagctcct ggcagttcca gccgggcggc agcgccgcgc gcggctggaa 4860 
acgctgctga tgcacgaagc cggacacgtg ctgcgcttcg atccagcgaa actcgacggc 4920 
agagcgacgc tgggtgatct cggattcgat tcgttgatgg ccctcgagtt tcgcaaccgt 4980 
ctggaagccg ggctgcgcgt caagctttct gccaccctga tctggcgtta cccgacattc 5040 
tccgccctgg cgcagcatct cgccgacaag ctcggcctgc cgctggaaag catggccggc 5100 
aatgctgaac cttcgaccgt tgctgccgtt gctacccttg etaccgttgg caccgccgcg 5160 
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ggcgaggacc ggagtcccgc cgctgcagac gatctcgacg ccgtcgcaaa ccagatcgcc 5220 
gggttggggg acaaagaaat cgaagctttg ttgaaacaga agttcgctca tttttcagga 5280 
gcctccgagt ga 5292 



<210> 118 
<211> 6462 
<212> ADN 
<213> bacterie 

<400> 118 

gtgagttcga tatccgagcg attccccaac cttacgccgt tgcagcaggc gtacctgacg 60 
ctggagcaca tgcagcgacg tctcgatgcg gccgaacgcg acgcgcgcga acccatcgcg 120 
atcgtgggtc tgggctgccg gtttccgggc ggcgatgggc ccgatgagtt ctggcagatg 180 
ttgcgcagtg gagtcgatgc tattcgtgag gtaccgcctg gacgatggga cgaggagtcg . 240 
gtccggcgca tcctgaaatc gttgaacccc gccacgccgg tgaagattca agccggattt 300 
ctcgattcca tcgatggttt cgacaacgat tttttcggca tttcgccacg cgaggccgtc 3 60 
agcattgatc cgcagcagcg gctgctgttg gaagtggcgt gggaggcact ggaggatgcg 420 
gggcagacga tggaagggct ctccggcagc cgcacgggcg tcttcgtcgg gatccacagc 480 
caaagcagcg actatttctg gatgcagacc gccgatggcg cgcgcatcga tccgtatacc 540 
gccaccggca cggcgcatag cgtgatcgcc ggccgacttt cctatttgct gaacttgcaa 600 
ggacccagca tcgcgctcga cacggcctgc tcgtcttcgc tggcggcggt tcatctggcg 660 
tgccagagcc tgcgcagcgg cgagtgtacg ctggccgtgg ccggcggagt gaatctgcgc 720 
ttctcgccgg agtttatgta cgccacctcg aagatgggaa ccgcctcgcc cagcggtcgc 780 
tgccgcgcct tcgacgcggc ggcggacggc atcgtgttcg gagaaggctg cggcgtggtg 840 
gtgctgaagc gcctgtccga tgcactcgcg gccggagacc gggtgtgggc cgtggtgcgc 900 
ggctccgcgg tcaatcagga tggccgctcg gccgggctca ccgctcccaa tgtcgtgtct 960 
cagcaggtcg tcatccggtc ggcattggcc aatgcgggcg tcgcggcgca gcagatcggt 1020 
tacatcgaag cccatggcac ggggactccg ctcggcgatc ccatcgagat cgaggcgctg 1080 
gcggaaaccg tcggcctccc gcgacctgtc ggcgatgtgt gcgcggtcgg gtccctgaaa 1140 
tcgaacatcg gccacctgga gggagcggca ggcatagcgg gattgattaa agcggtgctc 1200 
gcattgagtc acgagacgat accgccgagc ttacacgtga gacagctgaa cccgaatatc 1260 
cggttggagg gaacgtcgct cgacattgtg aaggaagtcc ggccgtggcc cgcgggttcg 1320 
agacgaaggt ttgcgggcgt cagcgcgttt ggttggtccg gcacgaacgc gcatgtcgtt 1380 
cttgaagaag cggcgccgac tggtagaggc gaagctgcga gcgggttcca ttcccgaccc 1440 
cccgccgccg ctgcgcgggc ggctgtcccc ctcgcggagg gggacactgg gggcactccc 1500 
gacattgcag gcactcccga cactgcagac actcccgaca ctgcagacac tcccgacatt 1560 
gcagggactg caggcactgc ggcaactacg ggcattgcag acgcgatgta tgtgcttccg 1620 
ctgtccgcgc atggtgcgga cgaactgcgt cgggtggcgc gggcatacgg ggaattgctg 1680 
acagcgtcgc acgcaccgag cctgcgtgat ctttgctaca cggccgcagt ccgccgcacg 1740 
catcaccgat gccggctcgc tgtttccggc agaacggctg aagaactggc ggcgcagctc 1800 
caggggatca cgatcccttc ccagcgacgg aagacggtat tcgtcttctc gggacaggga 1860 
tcgcaatgga tcggaatggg gcgcagctgg atggaccgcg aacccgttat tcgcgaggcg 1920 
ttggaacgct gcgaggccgc catgcggcct tatgtggact ggtcgctgaa agaagaactg 1980 
gcgaagctcg accgcgtcga ggtcattcag cctgcgctct tcgcgctgca ggtcgccatc 2040 
gccgcattgt ggcgttcctg gggaatcgag ccggatgccg tcatcgggca cagcatggga 2100 
gaggtcgccg ccgctcatgt cgcgggtgcg ctgacgctgc aggatgcggc gcggatcatt 2160 
tgcagccgca gccggctgtt gagccggatc agcggcctgg gcgggatggc gatggtggag 2220 
ctgccgctcg cggaatgtga ggccgtgctg tcgacttaca cggaacgact atcgcccgcg 2280 
gtgtcgaacg gacccaactc caccgtcatc tccggtgaag tcgaagccct ggccgaggtc 2340 
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gtcgcgacgc tggagcggcg aggcgtgtct tgccggccgg tgaaagtgga cttcgccgcg 2400 
catagcccgc aagtggaccc attgtgcgac gaactcctgc agtcgctcga cgggattcaa 2460 
ccgcggcccg cgaccatacc tttttactcc acggtgaccg gcgcgacgct ggagaccacc 2520 
agcctcgaca gcacgtactg ggctcgcaat ctgcgatcgc cggttctgtt ctggcagggc 2580 
atccgccatc ttgccgacag cgggcacgat gtctttctcg agatcagccc tcatcccatc 2640 
ctgctgcccg ccatcggcgg caatgcggcg ctggttccgt ctctgcgccg cgaccaggac 2700 
gaacgcggtt ccatgctcac gtcgctgggc gccctctatg aggctgggca cactgtcgca 2760 
tggcggaccg tgtacccttc cggcaattgc gtgcgcctgc cccggtatcc ctggcagcgt 2820 
cgtcgtttct ggctcgacgc ttcccccgcg cgacacgcga tcacgttggg caatccgctg 2880 
ttgggaaaac gcgtcgaagc ctcgacgcaa cccggcactt tcttctggga gacggaactc 2940 
agtctcgctt ccgtgccttg gctggcagac catcgcgtgc agggcgaagt cgtcttgccg 3000 
gctactgcgt atctcgatat ggctctggcc ggaacttccg agaccttcgg tgaaagtccg 3060 
tgcgtgctgg agcatgtgac tttcacacag atgctcattg tgccgcgcga cggcagcatg 3120 
acgttgcagc tggccatcgc ggtcgataga cccgggatgg cgtcgtttcg gatttccagc 3180 
cggcaggcat cgacatgggt cctgcatgct tccggggaca ttcgtcagac gcctgcggat 3240 
gcatcgaccg tcccgccgga ttctgcggag acggtgcagg cccgctgccc cacagtggtg 3300 
ccggcggcgg agctgtggcg tcagatggcg gagcacggcg tcgagtatgg tccggctttc 3360 
cgcgcgctcg agcagatctg gagttgtcca ggtgaggcga tcgggcgtct gcgtagctcg 3420 
gaaacgcgtt ccactgcgcc ggcgttcctc gatgcatgtc tgcagatcat cgccgcggcg 3480 
tttggtcccg ccggtggaac ctggctgccc gccggcatcg accggatgcg ctggctgcat 354 0 
cccgcacgtt ccgtggtgtg gacgcatgcg cggctggaag gacctatcgc cgatctgtcg 3600 
ctgctggacg gagagggaca actggtcgcc cgcatcgagg gtctgcggct gcagcgcctg 3660 
gatgcgtcgg agcgcatcga catgcgcggc tggttgcacg aactgcgctg ggtcgctcag 3720 
ccgcacgccg ctgcagagcc gccggcggcg cgagcggcgc ggtcatggct cattgtcggc 3780 
gctgtggata gcgcgctcac cgcatggctg cgcgctaccg gcaaccgcgt gacgcagacc 3840 
tcgccggaaa agctcgatga actccagccg ccgctcgagg aaatcgtgtt tttgctcgag . 3900 
cacgaaccct catgcgaccg cattctgcat ctcctccaga ccctggggcg cacgccctgg 3960 
cgtcaagcac cgcgcctatg gctggtcacg cgcggcgcgc agccggtcga tggacagatc 4020 
ctgcaagccg gtatcgctca ggcgcctttc tggggtttgg gccggaccgt gcattacgaa 4080 
catccggaac tgaactgcac gctgatcgat ctcgatcccg ccggcggcga agaggaactc 4140 
ctgcacgaac tgctgacgaa caacggcgag aatcaaatcg cctttcgcgg cggcgcgcgt 4200 
tacgtcgcgc gcgtggctcg gcacgaagcg gatatgcaac ccgccatgtt caaggccggc 4260 
gatcggccgt tccggctcga gatcgatgcc cccggagtcc tcgaccggct gcgcttgcgg 4320 
gccacatcgc gccgcccccc gcaagccggt gaagtggaga ttgaagtctg cgccgcgggc 4380 
ctgaacttcc tcgacgttct gctcgccctc ggcgttatgc ccgacgatgc gcccggcgcg 4440 
attgccggca gcccgcgcct gggcggcgaa tgctcgggcc gtatcgtggc catggggaaa 4500 
ggcgtcaccg actttcgcat cggagatgaa gtcgtggccc ttgcgccttg cagtttcggt 4560 
cgcttcgtca ccacgcccgc cttccgcgtt gccttgaagc cggccaacat tcccgccgaa 4620 
caggccgccg ccctgcctat cgcgtttctc accgccgatt acgcgctctc gcgagcggcg 4680 
cggctggcgc ccggcgaacg agtcctgatt cacgctgcca ccggcggtgt gggattggcg 4740 
gcaatccaga tcgcacagcg tgcgggcgcg gagatcttcg ctactgccgg gagtccggaa 4800 
aaacgagcgt atctgcgctc gctgggcatc gcgcatgttt cggattcgcg ctcgatggct 4860 
ttcgtggacg acatccgcaa ttggacgaat caagaaggag tagacgtcgt cctgaattcg 4 920 
ctttccggcg atctgctgga ggcgagcttc gatctgctgc gcgatcatgg acggttcatc 4980 
gagatcggca agcgcgatta ctatgccggc cgcaagctgg ggcttcgccc gttcctgaag 5040 
aacctctcgt acacgctggt cgatttgctc ggcatgtccc tgaagcgccc ggcattgacc 5100 
cgggagctgc tgcaggagat ggtcgcaaaa ttcgaatcgg aaacctggcg gcccctggaa 5160 
acgcgagtga cgaccatcac cgaatcggtg gaggcgtttc gcaccatggc gcaggcgcgg 5220 
cacatcggca aaatcgtcat ggcgatgcga gattgcgcca atgcgcccat cgcaccccta 5280 
cgctcggcgt tcgatagcga gggaacctac ttgattaccg gcggacttgg cgggctcggt 5340 
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cttaccgtcg cacgctggat gatcggacgc ggcgcccggc ggctggtgct gctgagccgc 5400 
cgcgcgcctt cacccgaggt ccagcaagcc atcgccgtca tggacgcaga tgtccggacg 5460 
gtgcaggccg atgtttctca gcgcgatgaa ctcgagcgcg tgatctcttc catcgatcga 5520 
ttgcgcggcg tgattcatgc cgcagccgtt ctcgacgatg cgctgctact gaaccagacg 5580 
gaagcgcatt tccgcaacgt gatggccgcg aaaatcgacg gtgcctggaa cctgcacttg 5640 
ctcacccgcg actgcccgct cgatcatttc gtgctcttct cctccgctgc aggactgctg 5700 
ggcgcgcccg cccagggaaa ctacgcggcc gcgaacgcct ttcttgacgc gctggcctac 5760 
taccggaagg cccaaggcct gccggcgctg agcatcggtt ggggtgcgtg gtcggaggtc 5820 
gggctggctg ccgcgcagga caatcgcgga tcgcggctgg ctttgcgcgg catggaaaac 5880 
ctgacgccgc aacacggcct cgctattctg gaacagctgc tgaacagctc ggcttgccac 5940 
gtcgccgcga tgcccatcaa tgtccgccag tggcggcagt tctatcccaa ggcggcgcag 6000 
tctgcactgt tcgagctttt gcatgacgac gcggcgagcg aagccgatgc gccaaacgcg 6060 
ttgcgcgcgc ggctgcaatc ggccgagcct cagacccgca ggacattgct cgaagaacat 6120 
ctacagcagc agctggcgcg cgtgctgcgc atcgactctc aaactatcga tcccctgcgc 6180 
ccgctgaagg aactcggctt cgattccctc atggccctgg agtttcgcaa ccgtctcgaa 6240 
ctcacactgg gtctcacgct ccccgcgacc ctgatttggg gtcatcccac gctggccggt 6300 
cttgccccgc acctggcgtc gcaaatggga ctgccgctgg tcgaagcgca ggccgcggct 6360 
gctgcggaag gagacagccg cgccatgaaa actgcactca gcgggttgga cgacatgtcg 6420 
gaagaagcag ccgtggctgc gctccgagga gcaaggtcgt ga 6462 



<210> 119 
<211> 5088 
<212> ADN 
<213> bacterie 

<400> 119 

gtgagggaaa aaattgcgcc catgtcgtcg gtcaaactcg cgctattggc gcggaacatg 60 
cggcaaaaca tcgcaggctt cgacctggtt cacgccgaac ccatcgccat cgtcggcatg 120 
gcgtgtcgtt ttccgggcgg cgcgaagaat ccggacgcct tctggacgct gttgaagaac 180 
ggtgtcgacg gtgtcaccga ggtgccgcca gaccgctgga actcggacca gtactactcc 240 
tccgatcccg atgctccggg caaggcgtat gcgcgatatg ccgccttcct cgaacgcatt 300 
gacggtttcg atgcggaatt cttcggcatc tccccccgcg aagctctgaa catggatccg 360 
cagcagcggc tgctgctgga agtgtgctgg gaagcggcag aggacgccgg catctctccc 420 
ggccctctgg cgggcagcgc gaccggcgtc tttgccggct cctgcgccca ggacttcgga 480 
ctgtttcagt acgccgaccc tgcccgcatc ggagcttggt cgggttccgg cgtggcgcat 540 
agcatgttgg ccaatcgcat ctcctatctg ctcgacctgc gcggtccgag catggcggtc 600 
gatacggcct gctcctccgc gctcgtcgcc gtccatctgg cttgccaaag cctgcgccgg 660 
cgcgaatgcg atgcggcatt cgccggcgga gtgaacttga tcctgactcc cgagggcatg 720 
atcgctttgt cgaaggctcg catgttggcg cccgacggac gctgcaagac gttcgacgcc 780 
gcagccgacg gttatgtgcg cggcgagggc tgcggcatcg tgctgctgaa gcggctctcc 840 
gatgcgctgg ccgatggcga tgccatccgt gcagtcatcc gcggctcggc aatcaatcag 900 
gacggacgga gcaatggcat cacggcgccg aatctgcagg cgcagaaggc ggtcctgcaa 960 
gaggcggtgg ccaacgcgca catcgatcca tcccacgtat cgttgatcga ggcgcatggc 1020 
acgggcacgt cgctgggcga tcctatcgag atcgaggccc tgcagtcggt ctacgacgcg 1080 
ccggactctg cgccttgtct gctgggttcc gtaaagacca acatcgggca tctggagggc 1140 
gcggcgggaa tcgccgggct gatcaaagcc gtactcgccc tgcagcatcg caccattcct 1200 
ccgcacctgc attttcgccg gctgaatccg aacatctcac tggacggcag ccggtttcgc 1260 
atcgccacgg aatcgtcgcc gtggacgtcg gaaggacggc cgcgtctggc cggcgtcagc 1320 
tcgttcggtt ttggagggag caacgcgcac gtcatcctcg aagaggcgcc tgcactccct 1380 
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ttgccgaagc cggtcacacg cccgcagctt ctcactctgt cggcgcgcac cgacgaagcg 1440 
ctcggcgaac tggccggcca cttcgcggag ttcctgcagt cgcacccgaa tgcgttgctg 1500 
tccgacgttt gcttcaccag tcaggttggg cgcgacgcat atagtcaccg cttggcgatc 1560 
accgccgcag atgcggcaga ggctgtagcg gcattggccg cggcgccgcg gcgcgaagta 1620 
tcgttgcgcc ggcggccggc aatcgctttt ctcttcaccg gccagggcgc gcagtacgcc 1680 
ggcatgggcg cagagcttta taaaacgcag cctgtttttc gcgacgcgct cgatcgttgc 1740 
gccgattggc tccgtcccca gctcgatgtt ccgctgaccg ttctcttgtt cgagtcggtt 1800 
tcgccgttgc acgagacggc gtatacccag ccggcaatgt ttgccctgga atgggctctg 1860 
gctcagttct ggctgtcgct cggcgtccgg ccggactacg tgctgggcca cagtctcggc 1920 
gagtatgttg cggcgtgtgt ggccggcgcc tttagcgtgg aggacggcct gcggctggtg 1980 
accgccaggg ggcggctggt caatgcgctt ccccgcggca aagcggtcat cgttcacgcc 2040 
aatccgagcc gcatcgcggc gctcgccgcc aaggtggcag tcgccgcatc gaatgcgccg 2100 
gaccgcaccg tgatctccgg cacggctgca gaaatcgcgg aagcgcaaga tgacctgcat 2160 
cgcgccggcg tggaaacgcg agagctgaac gtatcgcatg cgttccattc gccgctgatg 2220 
gatccgattt tggacaagtt cgaagcgctt gcaggtgcga tcgcgtatca gccgctggcg 2280 
atcccgctgg tgtcgaacgt cagcggagcc gtattgccga aaggcacgac actcgacgcc 2340 
cgctactggc ggcgacagtt gcgcgaaacc gtgcagtttg aaagcgcgat gcgaaccctg 2400 
gcggaccgcg agtgcaagct gtttctggaa atcggcccgc atcccacgct caccacgctg 2460 
gggcgatatt gtctgcccga tgacggcgcg gtctggctgc actccctatc taagggacga 2520 
tcggattggt ccgtgctgct ggaaagtctt ggcggcctgt ttaccgcggg cgtgaatccc 2580 
gactggcgcg gtctctatgc cggggaatca cccagccgcg tcgcgctgcc gacgtatccg 2640 
tttcagcgtg acaccttcag cctgagacgc gtacccgcga gagagccggc gcgcggcggc 2700 
atgttgggag cgcgcctcaa cagcgcgttg ggcgatgtca tcttcgaaaa ttcgctaacc 2760 
acggagacgc ctctgctcca tgagcacgtg atctacgacg cggtcattgt gcccggcgcc 2820 
tggcacgtgt cggcatttct cgaagcggca caggaagtct tcggtccggt tccctgcgcc 2880 
gtctccgatg tcatgatgcg gcaggcactg gccatcccgc cggatacgcc ggtcacggtg 2940 
caagcgattg tcacacccgg cgaggacggc gaagcaaagg tgcaggtctt cagccaggat 3000 
ggcgattcgt ggaagctcca cacggcagcc agtctgcgcg cggcgactgc cggcgccgtt 3060 
catttcgagc tgccggcgca gccttccgaa gtcatttccg gcgatgcgtt ctacggcgcg 3120 
atgaacgcac gcggcgtcga tcttggcccc gccttcagtt gggtggaaga agtctggcgt 3180 
cgcgatggcg aggcgctggg gcgaatgcgt ctgccggtgg ctgaggatgg cgcgaacgct 3240 
taccggctgc accccggcct gatcgattct tgttttcaag tattcggagc gacttggccc 3300 
gcggagcgtt gccagcccgg cgcatacgtg ccggtcggga tcgaagcggt gcgcttctac 3360 
cgtccgccgg caggttctct gcgctgtcat gcgcgtctgc gcccgagctc gagcggcccg 3420 
ttcgtcggtg atctgacgct ggttgaagag accggcgcgg tcatcgccga gttttccgga 3480 
ctggctgtaa tgcatgccgg tacgctgcaa tccgcacagt cgtggctgca ggatgtgcag 3540 
tggcaggagt gcgagcgatc gacaacgttg aagtccgacg gccctggcaa gccggaggac 3600 
tggttgctgt gtgccggcgc agacgatgtc gccggtttga tgccgcaaga • gctgcgcgtc 3660 
gtgtccggcg tcactctccg ccaggcgctg gaacagaccc agactttggt cggccgcccg 3720 
gcgcggctct ggctgatcac gcgcggcgtg catcgcatca gtgatgacga tgcgactccc 3780 
gtcgatcctt tccaggctcc actgtgggga ctcgggcagg cgatcgcgcg cgagcatccc 3840 
gagctgtggg gcggcctgat cgacctcggt tgcgacaatg ccgacatcgc cgccgccatg 3900 
ctgctggatg aaatccgtta tgccggcgac gacaaagcga tcgcattgcg caacggacgc 3960 
cgctacgttc gccggctggt gcggcacaag gaaacgtcga agcggccgcc tgccatttca 4020 
gccgacggcg tctatctgat caccggcggt ctcggcgcat taggacgaag ggtggcacgc 4080 
cgcttgatcg agcaaggcgc gcgccgtctg gtactggtcg gccggcatac ggaggcagtt 4140 
gccgatctcg agcaactcgg ggctgcagtc atggttgctg cttgcgatgt gagttccgag 4200 
caacagctgg cggcgctgct ggcggacccg cgcacccagc cgctgcgtgg agtcgtgcat 4260 
gccgcaggcg tgctcgatga cggggtagtt acagaacaga cgtgggctcg tttcgagaag 4320 
gtgctggcgc cgaagctgca gggtgcctgg aatcttcacc agctcactcg ccaccatgcg 4380 
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ctcgactttt tcgtactctt ctcttccgcc gcttcgctgc tcggttccgc cggacagagc 4440 
aattactcgg cggccaacgc atttctcgac agccttgccc acatgcgccg cgcgcaagga 4500 
ctaccggcgc tgagcatcaa ttggggacca tgggcgggcg aaggcatggc cgcgcgcatc 4560 
gcgcggcaag gcctgccggg ggtaccgctg ctgccgccgg aagtgggtgc gcgcatcttc 4620 
ggcgatctgc tgggcgagac tgccgctcag atcgcggtgt tccaagtctc cgccgaaaaa 4680 
aggcggagcc cggcgagcga tcccggcttc atccagcaac tcaccgaagc tgcgccggag 4740 
cggcggcagg aactgctgca gatgcgcatc cgcaagcagg ccggcggcgt gctggcgctc 4800 
gatgcgtcca agacgctcga cccgcgccgg ccgctcaagg aatacggact cgattcgctg 4860 
atggcgctgg atctggcgcg cgccatcgga gagctggtgc gcaagagcct tcccgcgaca 4920 
ttgctatacg accatccgac cgtcgagaaa ttggccggcc atgtcctccg cgaactcgga 4980 
ctcgacgtcc ccagcgattc cctcgtcgat gaagtgcggc agctgtccga gcaggagatg 5040 
gcggcgttca tcacggaaac cttgcaccat ctgggagagg aacgatga 5088 



<210> 120 
<211> 4306 
<212> ADN 
<213> bacterie 

<400> 120 

atgagcgatc tcactcctct tcaacaggcg gtcctggcgc tcaagcgcac gcgagcgcgt 60 
ctcgacgaac tggagagcgt ccacaacgaa cccatcgcga tcgtcggcat ggcttgccgc 120 
tttcccggcg cggactcgcc ggaagcattt tggcagctcc tgcacgatgg catcgatgcc 180 
atccgcgaaa ttcctgcggg ccgttgggat gccgatgcgt tttacgatcc cgatcccaac 240 
gcgccgggaa agatgtacac gcgtctgggc ggattcctcg atggtgccgt cgacggcttc 300 
gacgccggct tcttcggaat cacgccgcgc gaggtcgccg gtctggatcc gcagcagcgc 360 
ctgctgctcg aggtggcatg ggaagctttg gagcgtgcgg gtcggccgcc cgacagtctc 420 
gcgggcagcg acaccggagt gttcatcggg atcagcaccg acgactacag ccggctgaaa 480 
cctaccgatc cggcgctcat tgacgcctat accggtaccg gaaccgcgtt cagcactgcc 540 
gccggacgga tctcctatct gctggggttg cagggaccga acttccccgt cgacacggcg 600 
tgctcttcct cactcgtggc ggttcatctg gcgtgccgca gcttgcagtc gcgagagtgc 660 
agcatggcgc tggccggcgg cgtgaacctg attctggcgc cggaaagcac gatctacttc 720 
tgccgcctgc gggccatggc ggccgatggc cgttgcaaaa gtttcgctgc ctccgccgac 780 
ggttacggcc gcggcgaggg atgcggaatg ctggtgctga agcggctgtc cgatgcgacg 840 
cgtgacggcg atcgtattct ggcgctgatt cgcggatcgg ccgtcaacca cggcggccgc 900 
agcaacggcc tcacggcgcc gaacggtccg gcgcaggaag ccgtgattcg ggcggcgctc 960 
aagaacgccg gcatggcccc cgccgatgtc gattacgtgg aagcccacgg aaccgggacg 1020 
ccgctgggag atcccatcga actgcgggcg atggcagcgg tgctgggcga ggggcgtgcc 1080 
gtcgattctc cgttgatcgt cgggtcggtg aaaaccaact tcggccacct ggaggcggcg 1140 
gcaggtatcg ccggcctgat caagaccatt ctcgccctgc agcaccgaga gattccgccc 1200 
catctgcatt tcaacgcgcc caacccgcac gtactctgga atgagctgcc gctaaagata 1260 
gccaccgcat gttcgccatg gccctccaac ggccgccccc gagttgccgg ggtgagctcg 1320 
ttcggaatca gtggcaccaa ttcgcacgtc gtcctcgcag aagcgaagac gaatgtagaa 1380 
gcgaagacga atgtagaggc gaagacgaat gtagaggcga agacgagtga agaggtcaag 1440 
gcgagtgtag aggccaaagg gaatgtggag gctaaggcta gtgctagtgt ccccctcctc 1500 
gagggggaca gccgcccgcg aagcggcggc ggggggtcgg gccggccgcc cagccgcgag 1560 
gaagtgccgg tcccggatca actccatgcc gaagacggcc gcgaatacct cctaccgctt 1620 
tcggcgcgcc atccgcaggc tctgcgcgat ctcgccggcg cctatcgcga tgggcgcttt 1680 
cacgctccgc tctccgcgct gtgttccgcc gccagcctga cgcgcagtca ctacgaacat 1740 
cgcgcagcgt ttgtggcctc atccctgccc gagttcaatc aattgctcga ggccttccgg 1800 
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cgcaatgaaa ccaatcgcgg cgtcgccacc ggtttcgccg atcccggagt tcgtccgaaa 1860 
ctcgccttca tcttttccgg ccagggcgga cagtacccgc gcatggcgta tcgcctgtat 1920 
tccgacgagc ctgtcttccg atcggcgatc gaacgttgcg acgccgcctt ccgcagcttc 1980 
gtggaatggc ggcttgcgga cctgctcgcc gacgagtcgg gagcatggct gagccagatc 204 0 
gatcgcgtgc agcctgcgct gttcgccgtt caaatcgcgc tggtcgaact gctgcaatcc 2100 
tggggaattc gcccggacgg cgtggccgga cacagcabgg gagaagtggc ggcggcccat 2160 
gtcgcaggca ttctcaccct ggaggacgcg gcccgcatca tctgtcgccg cagccggctg 2220 
ttgctcggac ttcgcggccg gggagcgatg gctctggtcg aactgccgct cgatcgggcg 2280 
aaggccgtgc tcgctgaacg cggtctcact actgtttctg tcgcggccag caacggacca 2340 
cgcagcacgg tgttctcggg agaccgtgtg gctctcgagc atttgaagga cgacttcgag 2400 
aggcgcggcg tcttctgccg gctgattcag gtggatgtcg cttcacacag ctcgcaggtg 2460 
gacccgctcg agaacgaatt gcgccaggaa ctcggccgcg ttattgcaaa acgttccgcc 2520 
gtgccgttct tctccacggt tgaaggacag ttgagcacgg gcgaggcgtg cgacgcgtcg 2580 
tactgggtag ccaatctgcg acagccagtc cgtttctggg agtcgttgca ggcgatggct 2640 
ggtgatgagt tcacgcagtt cctggagatc agtccgcatc ctgtgctgac gccgtcgatc 2700 
gaggatagtc tgcggacgct cggcataaac ggactggttc gccccgtact gcgccgcgac 2760 
gaaccggagc ggcgtgagct gctcgagttg ctcgccgcgc tctacgtgaa tgggcagcgt 2820 
ccggactggc gcgcgctcgc ttcgtctccc gacacgcgcc tggatctgcc gacgtatccc 2880 
tggcagcgcg agcgcttctg gttcgcgacc tcgacgcggc gaagtttgcc ggcagttggc 2940 
ggtcatccgc tgctcggtcg caaggtcgag attgcgctgg cgccggacac acacgtctgg 3000 
gagtccgtgc tctctctgga tgcgctgccg tttctcgccg atcaccggct caacgagctt 3060 
gtggtgcttc ccggtgccgc ttatgtggag atggcgctgg ccgcagccaa ggaagtgttc 3120 
gcgggtggct gcagcctgga agagatccgg tttgaacaaa tgctggttgt tccttccgcg 3180 
ggcgcctcgc gagtgcaggt catactcgag ggacacgcat tccgcatctc cagtctggcc 3240 
gaaggcggtt ccgattggac cgagcacgcg cgcggcacca tggctgcggc gccggacaag 3 300 
gtcgcgccca cggtgagcct gcccacactt ggggatcgca tcgagggcga tgacttctat 3 360 
gcggccttcg catcgcaggg gatgcattac ggcgacacct tccgcggcat cgcggaagtg 3420 
tggcggcgcg acggcgaggc agtggcgcga ctgagcgtgc cggatgccgt tcgcgaagca 3480 
gagtccggtt acacgcttca tcctgccttg ctcgatgcct gtttgcaggt gctgggcgcg 3540 
acgcttggcg gcgaaggcag cgccggtcct tgcgtgcctg tcgccatcga acggttgcac 3600 
tgtttcggca gacccgccgg cgatcttagg gtgcatgcgc ggctgacggg gcggctcgag 3660 
ggcgatgtca ccctgtgtga tgcggaaggc cacgtcatcc tcgaggtcca aggcctgcgt 3720 
gcccaggaac tggagcgcca atccgaatgg ttccacgcta tggaatggga gccgcagctg 3780 
ctggccgaga gtccaacggc aacggtgtcg ggtgcatggc tggtcattgc cgatgccggc 3840 
ggcatcgcag ccgcggtggc gcgagggctg ggcacaaaca cggttgtgat ttcgggtcgc 3900 
gatgccgaga taccggatca gccttaccgg ggcgtcattc actgcgggag cctggatgag 3960 
accgaggatg agaccgatcc gtcggctgcg gggggaaccg cctgcgaaga cattttgcgc 4020 
atcgttcaag aattcggagt gggacgcata cagctgacga aacaagcgtc cgacgccgaa 4080 
tcgcagcatc cgcgaatctg gctgattacg gcgggcgttc atgcggagca tctgcagatg 4140 
ccggtggtgc ccgcgcgggc accggtgtgg ggtctgggac gtaccatcgc ggccgagcat 4200 
cccgagttcg cttgcacctg catcgatctc gacactgccg gtgaagtcga ggtgcaggcg 4260 
ctctgccgag agattctcgc ggggagttct gaacgtcagg gcccgg 4306 
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<211> 1537 
<212> PRT 
<213> bacterie 
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Leu Gin Cys Pro Glu Ser Ala Val Asp Leu Gin Gin Pro Leu Val Arg 
15 10 15 

Met Gly Leu Asp Ser Leu Met Ala Val Gin Leu Arg Asn Arg He Asp 
20 25 30 

Thr Asp Leu Arg Val Leu Leu Pro Met Val Arg Phe Leu Asp Gly Pro 
35 40 45 

Ser Val Ala Glu Leu Ala Arg Asp Leu Ser Asp Leu Ser Gly Leu Ser 
50 55 60 

Glu Arg Thr Thr Val Ala Pro Glu Pro Ala Ala Gin Ala Ser Val Pro 
65 70 75 80 

Ala Leu Ser Tyr Pro Leu Ser Ala Gly Gin Gin Ala Leu Trp Phe He 
85 90 95 

Tyr Arg Ser Ala Pro Glu Ser Pro Ala Tyr Asn He Ala Trp He Ala 
100 105 110 

Arg Ala Arg Gly Ala Phe Asp Pro Gin Ala Leu Arg Arg Ser Leu Gin 
115 120 125 

Asp Leu Val Asp Arg His Pro Ala Leu Arg Thr Thr He Ala Glu Ser 
130 135 140 

Gly Gly Ala Pro Val Gin Thr Val His Ser Ser Val Pro Val Asp Phe 
145 150 155 160 

Glu Val He Pro Cys Ser Pro Asp Asp Glu Ala Val Leu He Asp Gly 
165 170 175 

Val Phe His Ala Pro Phe Asn Leu Gly Glu Asn Cys Phe Arg Ser Arg 
180 185 190 

Leu Leu Val Gin Ser Gly Lys Asp Gin Val Leu Ala He Val Val His 
195 200 205 

His He Leu Ala Asp Phe Trp Ser Leu Leu Val Met Val Asp Glu Leu 
210 215 220 

Arg Ser He Tyr Leu Ala Arg Thr Ala Gly Gly Pro Pro Val Ala Pro 
225 230 235 240 



Pro Val Ala Ser Phe Ala Ala Phe Val Arg Trp Gin Asn Glu Leu Leu 
245 250 255 

Ala Gly Thr Glu Gly Glu Arg Leu Trp Asn Tyr Trp Ser Ser Gin Leu 
260 265 270 
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Ser Gly Gin Leu Pro Val Leu Asn Leu Pro Ser Asp Arg Pro Ser Pro 
275 280 285 

Pro Val Gin Ser Phe Arg Gly Asn Ser His Ser Phe Arg lie Glu Pro 
290 295 300 

Ala Leu Thr Ala Lys Leu Lys Ala Leu Ala Arg Arg Gin Asn Ala Thr 
305 310 315 320 

Leu His Ala Thr Leu Met Ala Ala Phe Gin Val Leu Leu Ser Arg Trp 
325 330 335 

Thr Ser Gin Glu Glu He Leu Thr Gly Thr Leu Thr Asn Gly Arg Thr 
340 345 350 

Gin Pro Glu Phe Ala Asp Leu Val Gly Tyr Phe Val Asn Pro Val He 
355 360 365 

Leu Arg Gly Glu Leu Ser Gly Asp Pro Asp Phe Asn Thr Val Leu Ala 
370 375 380 

Arg He Arg Gin Thr Leu Leu Gly Ala He Glu His Gin Glu Tyr Pro 
385 390 395 400 

Tyr Ala Arg He Val Glu Arg Leu Gly Pro Gly Leu Arg Val Leu Phe 
405 410 415 

Val Leu Gin Gin Pro His Arg He Pro Glu Ser Val Pro Phe Met Leu 
420 425 430 

Gly Gin Ser Gly Gly Arg Met Ala Trp Gly Ser Leu Thr Leu Glu Ser 
435 440 445 

Leu Ala Met Pro Leu Arg Gin Ser Arg Phe Asp Leu Asp Leu Met Met 
450 455 460 

Val Glu Thr Asp Gly Gly Leu Ser Ala Phe Leu Gin Tyr Ash Thr Asp 
465 470 475 480 

He Phe Asp Ala Ala Thr He Glu Arg Leu Ser Leu His Phe Ala Val 
485 490 495 

Leu Leu Glu Gly He Ala Glu Asn Pro Ala Cys Pro Val Val Asp Leu 
500 505 510 

Pro Leu Leu Thr Thr Arg Glu Arg He Gin Leu Leu Glu Glu Trp Asn 
515 520 525 



Ala Thr Ala Ala Glu Phe Pro Ser Gin Cys Val His Glu Leu Phe Glu 
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Ala Gin Val Glu Leu Thr Pro Asp Ala He Ala Leu Ser Phe Gly Glu 
545 550 555 560 

Gin Asn Leu Thr Tyr Arg Glu Leu Asn Gly Ser Ala Aan Arg He Ala 
565 570 575 

His Tyr Leu Arg Ser Arg Gly Ala Gly Pro Gly Glu Met Val Gly He 
580 585 590 

His Val Thr Arg Ser Leu Glu Thr Val Ala Gly Leu Leu Gly Val Leu 
595 600 605 

Lys Ala Gly Ala Ala Tyr Val Pro Leu Glu Pro Glu Tyr Pro Ala Gin 
610 615 620 

Arg Leu Arg Leu Met Leu Glu Glu Thr Arg Pro Val Val Val Leu Asn 
625 630 635 640 

Val Thr Glu Ser Glu Val Trp Thr Gin Pro Asp Thr Asn Pro Asn Pro 
645 650 655 

Leu Ala Thr Pro Ala Asp Leu Ala Tyr Val Leu Tyr Thr Ser Gly Ser 
660 665 670 

Thr Gly Arg Pro Lys Gly Val Gin He Thr His Gin Ala Val Val Asn 
675 680 685 

Phe Leu Ser Ser Met Arg His Glu Pro Gly He Ser Asp Arg Asp Thr 
690 695 700 

Leu Leu Ala Leu Thr Thr Phe Met Phe Asp He Ser Ala Leu Glu He 
705 710 715 720 

Phe Leu Pro Leu Ser Ala Gly Ala Arg Val Val Val Ala Asn Gin Glu 
725 730 735 

Thr Ala Val Asp Gly Glu Arg Leu Ala Arg Glu Leu Ala Arg Ser Lys 
740 745 750 

Ala Thr Met Met Gin Ala Thr Pro Ala Thr Trp Arg Leu Leu Leu Ala 
755 760 765 

Ser Gly Trp Pro Gly Asp Arg Arg Leu Thr Ala Leu Cys Gly Gly Glu 
770 775 780 

Ala Leu Pro Arg Asp Leu Ala Asp Arg Leu Leu Gin Arg Thr Ala Ala 
785 790 795 800 
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Leu Trp Asn Leu Tyr Gly Pro Thr Glu Thr Thr He Trp Ser Ala He 
805 810 815 

Gin Arg Val Thr Thr Gly Asp Gly Pro Val Ser He Gly Arg Pro He 
820 825 830 

Ala Asn Thr Gin Leu Tyr Val Leu Asp Asp Arg Met Gin Pro Ala Pro 
835 840 845 

He Gly Val Ala Gly Glu Leu Tyr He Gly Gly Ala Gly Leu Ala Arg 
850 855 860 

Gly Tyr Leu Asn Arg Pro Glu Leu Ser Ala Asp Lys Phe Val Ala Asn 
865 870 875 880 

Ser Phe Asp Pro His Gly Thr Arg Leu Tyr Arg Thr Gly Asp Leu Ala 
885 890 895 

Arg Arg Gin Arg Asp Gly Ala Leu Glu Tyr Leu Gly Arg He Asp His 
900 905 910 

Gin Val Lys He Arg Gly Phe Arg He Glu Thr Gly Glu He Glu Ala 
915 920 925 

Ala Val Arg Ser His Pro Ala Val Arg His Ala Val Val Thr Ala Arg 
930 935 940 

Glu Asn Asp Ala Ala Gly Lys Tyr Leu Ala Ala Tyr He Val Pro Leu 
945 950 955 960 

Ala Asp Gly His Arg Ala Thr Ala Ala Ala Asp Thr Phe His Asp Arg 
965 970 975 

Val Glu Ser Glu His Val Thr Gin Trp Gin Ser Val Trp Asp Thr Thr 
980 985 990 

Tyr Glu Gin Asn Ala Pro Asn Ala Asp Pro Glu Phe Asn He Val Gly 
995 1000 1005 

Trp Arg Ser Ser Val Thr Gly Glu Pro He Pro Ala Ala Glu Met Arg 
1010 1015 1020 

Glu Trp Val Gin Asp Ser Val Asp Arg He Leu Ala Ser Arg Pro Arg 
1025 1030 1035 1040 

Arg Val Leu Glu He Gly Cys Gly Thr Gly Leu Leu Leu Phe Arg Val 
1045 1050 1055 

Ala Pro His Cys Ser Glu Tyr Trp Ala Thr Asp Phe Ser Gin Lys Ala 
1060 1065 1070 
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Leu Asp Tyr lie Ala Ala His Ala Asp Arg Thr Gly Leu Ala Aan Val 
1075 1080 1085 

Arg Thr Phe Arg Gin Ala Ala Asp Asp Ala Cys Glu lie Asp Ser Arg 
1090 1095 1100 

Ser Cys Asp Ala Val Val Leu Asn Ser Val lie Gin Tyr Phe Pro Gly 
1105 1110 1115 1120 

Glu Ala Tyr Leu Arg Arg Val Leu Ala Glu Ala Val Arg Val Val Lys 
1125 1130 1135 

Pro Gly Gly lie Val Phe Val Gly Asp Val Arg Ser Leu Pro Leu Leu 
1140 1145 1150 

Glu Thr Phe Tyr Ala Ser Leu Glu Val Gin Arg Ala Pro Ala Ser Leu 
1155 1160 1165 

Thr Arg Asn Glu Phe Arg Gin Arg Val Arg Ser Leu Ala Ser Gin Glu 
1170 1175 1180 

Glu Glu Leu Val Val Asp Pro Ala Phe Phe Phe Ala Leu Arg Glu Gin 
1185 1190 1195 1200 

lie Pro Glu lie Gly Arg lie Glu lie Leu Pro Arg Arg Gly Arg Ser 
1205 1210 1215 

His Asn Glu Leu Thr Arg Phe Arg Tyr Gin Ala lie Leu His lie Gly 
1220 1225 1230 

Ser Arg Glu Ala Glu Glu Pro Glu Ser Asp Arg Arg Arg Cys Gin Thr 
1235 1240 1245 

Ala Ala Glu lie Arg Arg Val Leu Thr Asp Ala Gin Pro Glu Leu Ala 
1250 1255 1260 

Ala Phe Thr Glu He Pro Asn Ala Arg Leu Thr Ala Glu Ser Ala He 
1265 1270 1275 1280 

Val Thr Trp Met Asn Gly Asp Glu Ala Pro Glu Thr Leu Gly Glu Leu 
1285 1290 1295 

Arg Asp Arg Leu Arg Gin Thr Ser Pro Ser Gly Val Asp Pro Ala Asp 
1300 1305 1310 

Leu Trp Arg Met Asp Glu Asp Leu Pro Tyr Arg Val Ala He Asp Trp 
1315 1320 1325 

Ser Ser His Gly Pro His Gly Arg Phe Asp Ala Thr Phe Cys Arg Ala 
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Ala Ala Gly Pro Pro Ala Ser Arg Pro Arg Arg Arg Leu Ala Gly Pro 
1345 1350 1355 1360 

Tyr Thr Asn Asp Pro Leu Arg Ala Val Tyr Thr Arg Thr Val Val Pro 
1365 1370 1375 

Gin Leu Arg Thr His Leu Lys Glu Lys Leu Pro Asp Tyr Met lie Pro 
1380 1385 1390 

Thr Ala Trp Val Val Leu His Glu Met Pro Leu Thr Pro Asn Gly Lys 
1395 1400 1405 

lie Asp. Arg Asn Ala Leu Pro Asp Pro Glu Pro Ser Arg Arg Ala His 
1410 1415 1420 

Ala Glu Ala Phe Thr Pro Pro Glu Thr Pro Val Glu Gin Val Leu Ala 
1425 1430 1435 1440 

His lie Trp Gly Glu Val Leu Gly Met Asp Gly He Gly Val His Asp 
1445 1450 1455 

His Phe Phe Asp Ser Gly Gly His Ser Leu Leu Val Thr Gin Met He 
1460 1465 1470 

Ala Arg Val Arg Asp Met Leu His Val Glu Val Pro Phe Arg Thr Val 
1475 1480 1485 

Phe Asn Ala Pro Thr Val Arg Gly Phe Ala Val Ala He Gin Asp Gly 
1490 1495 1500 

Val Asp Pro Gly Trp Ala Arg Arg Ala Ala Asp Leu Leu He Ala Val 
1505 1510 1515 1520 

Ser Gin Met Ser Asp Val Gin He Glu Arg Met Met Ser Ala Ala Gin 
1525 1530 1535 



<210> 122 
<211> 2766 
<212> PRT 
<213> bacterie 

<400> 122 

Met 61n Asn Ser Ser Pro Asn Thr He Asp Leu Ser Leu Ala Arg Arg 
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1 



5 



10 



15 



Gin Leu Leu Asp Arg Leu Leu Gin Glu Asn Ser Pro Glu His Arg lie 
20 25 30 

Pro Arg Arg Glu Asn Arg Asp Ala Ala Pro Leu Ser Leu Ala Gin Gin 
35 40 45 

Arg Leu Trp Phe Leu His Gin Leu Asp Pro Asp Ser Pro Ala Tyr Asn 
50 55 60 

He Pro He Ala Leu His He Arg Gly Pro Leu Asp He Arg Val Leu 
65 70 75 80 

Leu Arg Ser Leu Glu Ala Val Val Gin Arg His Glu Ser Leu Arg Ser 
85 90 95 

Cys He Gly Gly Val Asp Gly Glu Ala Arg Gin Ser Leu Leu Ala Arg 
100 105 110 

Val Thr Leu Glu Leu Pro Val Val Gin Ala Asp Gly He Ala Glu Ala 
115 120 125 

Arg Gin Met Ala Leu Arg Asp Ala Gin He Pro Phe Asp Leu Arg Lys 
130 135 140 

Pro Pro Leu Leu Arg Thr Lys Leu He Cys Leu Asp Asp Lys Gin Gin 
145 150 155 160 

He Leu Leu Leu Thr Leu Ser His He He Ala Asp Ala Trp Ser Val 
165 170 175 

Glu Thr Phe Val Arg Asp Leu Thr Arg Ser Tyr Glu Ala Phe Val Gin 
180 185 190 

Gly Arg Pro Ser Pro Leu Met Glu Leu Pro He Gin Tyr Gly Asp Trp 
195 200 205 

Ala Val His Gin Gin Thr Ser Leu Asn Gin Thr Ala Gin Gin Tyr Trp 
210 215 220 

Lys Lys Gin Leu Ser Gly Thr Leu Pro Phe Leu Asp Leu Pro Thr Asp 
225 230 235 240 

Arg Pro Arg Pro Ala Gin Gin Thr Trp Arg Gly Ala Val Glu Thr Thr 



245 



250 



255 



Ala Leu Gly Arg Asp Leu Thr Asp Gly Leu His Ala Phe Ala Leu Arg 
260 265 270 
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Glu Gly Ala Thr Val Phe Met Thr Ala He Ala Ala Phe Gin Val Leu 
275 280 285 



Leu His Arg Tyr Thr Ala Gin Glu Asp He Leu He Gly Val Pro Val 
290 295 300 



Ala Gly Arg Thr Gin Arg Glu Thr Glu Gly Leu Val Gly Cys Phe Ala 
305 310 315 320 



Asn Met He Val Leu Arg Gly Asp Leu Arg Asp Asp Pro Ser Phe Arg 
325 330 335 



Ser Leu Leu Ala Arg Thr Arg Asp Thr Ala Leu Ser Ala Leu Ser His 
340 345 350 



Gin Asp Phe Pro Phe Glu Arg Leu Val Glu Glu Leu His Pro Pro Arg 
355 360 365 



Asp Leu Ser Arg Ser Pro Val Phe Gin Val Ser Phe Ala Leu Leu Pro 
370 375 380 



Asp Ala Pro Ala He Thr Val Met Pro Gly Leu Thr He Ser Arg Glu 
385 390 395 400 



Tyr Met His Asn Gly Gly Ser Lys Leu Asp Leu Gly Val Thr Leu Glu 
405 410 415 



Pro Ser Gly Asp Gly Leu Met Ala Ser Ala Glu Tyr Asn Thr Asp Leu 
420 425 430 



Phe Asp Ala Ala Thr He Ala Ser Leu Leu Asp Ala Tyr Arg Thr Leu 
435 440 445 



Leu Ala Ser Val Val Thr Asp Pro Asp Val Arg He Ser Thr Ala Ala 
450 455 460 



Leu Leu Ser Pro Ala Val Arg Ser Arg Met Leu Glu Gin His Asn Ala 
465 470 475 480 



Thr Arg Arg Asp Ala Gly Pro Asn Gly Cys Ala His Glu Leu Val Glu 
485 490 495 



Ala Gin Ala Glu Arg Thr Pro His Ala Val Ala Val Val Phe Glu Asp 
500 505 510 



His Gin Leu Thr Tyr Ala Glu Leu Asn Ala Arg Ala Asn Arg Leu Ala 
515 520 525 



His Arg Leu Ser Ala Ser Gly Ala Gly Pro Gly Lys He He Ala Leu 
530 535 540 
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Ala Met Glu Arg Ser Leu Glu Met Val He Ala Leu Leu Ala He Leu 
545 550 555 560 

Lys Ser Gly Ser Ala Tyr Leu Pro Leu Asp Pro Ala His Pro Lys Asp 
565 570 575 

Arg Leu Ala Arg He Leu Asp Glu Val Gin Pro His Ala Val Leu Thr 
580 585 590 

Gin Glu Ala Val Ala Glu Met Met Ala Met Met Ala Met Met Ala Val 
595 600 605 

Ala Val Glu Pro Glu Ala Ala Asn Leu Val Ser Gly Ser Lys Pro Asp 
610 615 620 

Asp Leu Ala Tyr He He Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys 
625 630 635 640 

Gly Val Glu He Arg His Ser Ser Leu Val Asn Leu Leu Arg Ser Met 
645 650 655 

Gin Arg Glu Pro Gly Leu Thr Ala Ala Asp Gly Leu Val Ala Val Thr 
660 665 670 

Thr Val Ser Phe Asp He Ala Gly Leu Glu He Trp Leu Pro Leu He 
675 680 685 

Thr Gly Ala Arg Val He Val Ala Thr Arg Glu He Val Val Asp Gly 
690 695 700 

Glu Arg Leu Thr Thr Leu Leu Asp Lys Ser Gly Ala Thr Val Met Gin 
705 710 715 720 

Ala Thr Pro Ser Gly Trp Arg Gin Leu Leu Asp Ser Gly Trp Lys Pro 
725 730 735 

Gly Lys Gly Phe Arg Val Phe Cys Gly Gly Glu Ala Leu Pro Pro Glu 
740 745 750 

Leu Ala Arg Arg He Leu Asp Ser Gly Val Glu Leu Trp Asn Leu Tyr 
755 760 765 

Gly Pro Thr Glu Thr Thr He Trp Ser Ala Val His Lys Thr Gin Arg 
770 775 780 

Leu Gly Ala Ser Asp Ser He Val Pro He Gly His Pro He Asp Asn 
785 790 795 800 

Thr Gin Leu Tyr He Leu Asp Ser Arg Met Glu Pro Val Pro Pro Gly 
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805 



810 



815 



Val Pro Gly Glu Leu Tyr lie Gly Gly Ala Gly Leu Ala Arg Gly Tyr 
820 825 830 

His Arg Asn Pro Glu Leu Thr Arg Glu Lys Phe Arg Glu Trp Arg Asp 
835 840 845 

Arg Gly Arg lie Tyr Ser Thr Gly Asp Leu Ala Arg Tyr Arg Ser Asp 
850 855 860 

Gly Ala Val Glu Cys Leu Gly Arg Val Asp Arg Gin lie Lys Leu Arg 
865 870 875 880 

Gly Phe Arg He Glu Pro Ala Glu He Glu Ala Ala He Glu Thr His 
885 890 895 

He Ala Val Lys Gin Ala He Thr Val Val Lys Asp Asp Arg Leu He 
900 905 910 

Ala Tyr Leu Val Pro Ala Thr Gly Asp Val Arg Asp Leu Gin Ser Asp 
915 920 925 

Leu Arg Ser Trp Leu Ala Thr Arg Leu Pro Asp Tyr Met He Pro Ser 
930 935 940 

Ala Phe Val Ser Leu Ser Ser Leu Pro Leu Thr Pro Asn Gly Lys He 
945 950 955 960 

Asp Ala Asn Ala Leu Pro Gly Leu Pro Thr Thr Pro Val Ala Ala Arg 
965 970 975 

Glu Pro Met Arg Gly Asp Val Val Glu Thr He Ala Ser He Trp Arg 
980 985 990 

Glu Val Leu Arg Val Glu His Val Asp Tyr Arg Gin Asn Phe Phe Asp 
995 1000 1005 

Val Gly Gly His Ser Leu Met Leu Thr Arg Val Arg Gly Leu Leu Glu 
1010 1015 1020 

Glu Arg Leu Gly Leu Thr Leu Ser Val Val Asp Leu Phe Arg His Thr 
1025 1030 1035 1040 

Thr He Glu Ser Leu Ala Gly Leu Ala Glu Lys Ser Glu Pro Ala Ala 



1045 



1050 



1055 



Ala Glu Pro Ala Ala Ala Val Ala Glu Asp Arg He Ala Val He Gly 
1060 1065 1070 
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Met Ala Gly Arg Phe Pro Gly Ala Arg Asn Val Glu Glu Phe Trp Arg 
1075 1080 1085 

Asn Leu Arg Asp Gly Val Asp Ser lie Ala Arg Leu Ser Pro Glu Asp 
1090 1095 1100 

Leu Leu Ala Gly Gly lie Ser Pro Glu Val Phe Gin Asp Pro Ser Tyr 
1105 1110 1115 1120 

Val Pro Ala Lys Gly Leu Leu Asp Gly lie Glu Phe Phe Asp Ala Ala 
1125 1130 1135 

Phe Phe Gly Tyr Ser Pro Arg Glu Ala Glu He Met Asp Pro Gin His 
1140 1145 1150 

Arg Val Phe Leu Glu Cya Ala Trp Glu Ala Met Glu Asn Ala Gly Tyr 
1155 1160 1165 

Ala Ala Arg Ser Tyr Lys Gly Ser He Gly Val Phe Ala Gly Cys Gly 
1170 1175 1180 

Val Asn Thr Tyr Leu Leu Asn Asn Leu Ala Thr Ala Glu Pro Phe Asp 
1185 1190 1195 1200 

Phe Ser Arg Pro Ser Ala Tyr Gin Leu Leu Thr Ala Asn Asp Lys Asp 
1205 1210 1215 

Phe Leu Ala Thr Arg Val Ser Tyr Lys Leu Asn Leu Arg Gly Pro Ser 
1220 1225 1230 

Leu Thr Val Gin Thr Ala Cys Ser Thr Ser Leu Val Ser Val Val Met 
1235 1240 1245 

Ala Cys Glu Ser Leu Gin Arg Gly Ala Ser Asp He Ala Leu Ala Gly 
1250 1255 1260 

Gly Val Ala He Asn Val Pro Gin Ser Val Gly Tyr Leu His Gin Pro 
1265 1270 1275 1280 

Gly Met He Leu Ser Pro Asp Gly Arg Cys Arg Ala Phe Asp Glu Ser 
1285 1290 1295 

Ala Gin Gly Thr Val Pro Gly Asn Gly Ala Gly Val Val Val Leu Lys 
1300 1305 1310 

Arg Leu Ser Arg Ala Leu Ala Asp Gly Asp Thr He Tyr Ala Val lie 
1315 1320 1325 

Arg Gly Ala Ala He Asn Asn Asp Gly Ala Glu Arg Met Gly Phe Thr 
1330 1335 1340 
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Ala Pro Gly Val Asp Gly Gin Thr Arg Leu lie Arg Arg Thr Gin Glu 
1345 1350 1355 1360 

Met Ala Gly Val Lys Pro Glu Ser He Gly Tyr He Glu Ala His Gly 
1365 1370 1375 

Thr Ala Thr Pro Leu Gly Asp Pro Val Glu He Ala Ala He Ala Ala 
1380 1385 1390 

Asn Phe Pro Lys Aan Gly Ser Gly Asp Val Tyr He Gly Ser Val Lys 
1395 1400 1405 

Thr Asn He Gly His Leu Asp Val Ala Ala Gly Val Ala Gly Leu He 
1410 1415 1420 

Lys Thr Val Leu Ala Val His Arg Gly Gin He Pro Pro Ser Leu Asn 
1425 1430 1435 1440 

Phe Gin Arg Pro Asn Pro Arg He Asp Phe Ala Asn Thr Pro Phe Arg 
1445 1450 1455 

Val Ser Thr Arg Leu Leu Asp Trp Pro Ala Gly Lys Thr Pro Arg Arg 
1460 1465 1470 

Ala Ala Val Ser Ser Phe Gly He Gly Gly Thr Asn Ala His Val He 
1475 1480 1485 

Leu Glu Gin Ala Pro Pro Val Thr Pro Ala Ala Ala Ala Pro Glu Arg 
1490 1495 1500 

Ser Ala His Val Leu Cys Leu Ser Ala Asn Thr Asp Ala Ala Leu Glu 
1505 1510 1515 1520 

Glu Leu Val Arg Ser Tyr Arg Gly His Met Asp Asn Gin Pro Gly Leu 
1525 1530 1535 

Ser Phe Gly Asp Val Ala Phe Thr Ala Asn Ala Gly Arg Val His Phe 
1540 1545 1550 

Pro His Arg He Cys He Val Ala Arg Ser Ser Asp Glu Ala Arg Gin 
1555 1560 1565 

Arg Leu Thr Glu Ala Arg Arg Val Arg He Ala Gin Thr Arg Pro Lys 
1570 1575 1580 

lie Ala Phe Leu Phe Thr Gly Gin Gly Ala Gin Tyr Ala Gly Met Gly 
1585 1590 1595 1600 

Arg Gin Phe Tyr Glu Ser Gin Pro Val Phe Arg Ala Ala Met Asp Glu 
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1605 



1610 



1615 



Cys Ala Ala Leu Leu Asn Gly Arg Leu Asp Leu Pro Ala Leu Leu Ala 
1620 1625 1630 

Asp Asp Ala Leu Leu Asp Ala Thr Ala Gly Ala Gin Pro Ala Leu Phe 
1635 1640 1645 

Ala Leu Gin Trp Ala Leu Ala Gin Leu Tip Lys Ser Trp Gly Val Thr 
1650 1655 1660 

Pro Asp Leu Val Met Gly His Ser Val Gly Glu Tyr Ala Ala Ala Cys 
1665 1670 1675 1680 

He Ala Gly Ala Val Ser Leu Pro Asp Ala Leu Gly Leu Val Ala Glu 
1685 1690 1695 

Arg Gly Arg Leu Met Gin Asn Leu Pro Glu Gly Ala Met Ala Ala Val 
1700 1705 1710 

Ser Ala Gly Glu Gin Arg Cys Ala Ala Ala He Thr Ser Arg Val Ser 
1715 1720 1725 

He Ala Ala He Asn Gly Pro Ala Glu Val Val He Ser Gly Ala Pro 
1730 1735 1740 

Gin Asp He Glu Ser Ala Leu Ala Thr Leu Arg Ala Glu Gly He Lys 
1745 1750 1755 1760 

Thr Gin Met Leu Ala Val Ala Arg Ala Phe His Ser Ser Ser Met Asp 
1765 1770 1775 

Pro He Leu Ala Asp Leu Gin Arg Arg Ala Ala Ala He Ala Trp Arg 
1780 1785 1790 

Asn Pro Ser He Gly Leu Val Ser Asn Leu Thr Gly Lys Leu Ala Gly 
1795 1800 1805 

Glu Gly Gin Leu Ala Asn Pro Leu Tyr Trp Arg Asp His Ala Arg Asn 
1810 1815 1820 

Pro Val Arg Phe Ala Asp Gly He Gin Thr Leu Lys Asp Glu Gly Cys 
1825 1830 1835 1840 

Asp Val Phe Leu Glu He Gly Pro Lys Pro Val Leu Leu Gly Met Gly 



1845 



1850 



1855 



Gin Lys Cys Leu Pro Asp Asp Ala Lys Gin Trp Leu Pro Ser Leu Arg 
1860 1865 1870 
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Lys Gly Arg Asp Glu Trp Glu Thr He Leu Ser Ser Val Ala Thr Leu 
1B75 1880 1885 

Tyr Gin Gly Gly Phe Asp He Asp Trp Gin Glu Phe Asp Arg Pro Tyr 
1890 1895 1900 

Ser Arg Arg Arg Val Ala Leu Pro Ala Tyr Pro Phe Glu Arg Arg Arg 
1905 1910 1915 1920 

His Trp He Glu Arg Ser Ser Arg Pro Glu Pro Val Ala Val Ala Ser 
1925 1930 1935 

Gly Leu Val Gly Cys Arg Leu Ser Leu Pro Val Ala Asp Val He Phe 
1940 1945 1950 

Glu Ser Lys Leu Ser Thr Ala Ser Pro Leu Leu Ser Asp His Arg Tyr 
1955 1960 1965 

Tyr Gly Ser Val Val Ala Pro Ala Val Tyr Phe Leu Ala Met Ala Leu 
1970 1975 1980 

Glu Ala Ser Ala Glu Val Phe Gly Ala Gly Arg His Thr Leu Glu Asn 
1985 1990 1995 2000 

Val Asn Phe Ala His Pro Leu He Leu Ser Ala Glu Arg Asp Thr Ala 
2005 2010 2015 

Val Gin Leu Val Leu Ser Gin Ser Asp Asp Arg His Ala Ser Phe Arg 
2020 2025 2030 

He Leu Ser Leu Ser Asp Gly Ser Trp Asn Leu His Ala Ala Gly Asn 
2035 2040 2045 

He Ala Ala His Ala Gly Val Ala Pro Val Pro Arg Leu Val Asp Glu 
2050 2055 2060 

Arg Arg Pro Ala Val Asp Gly Asp Thr Tyr Tyr Ser Leu Leu Arg His 
2065 207.0 2075 2080 

Leu Glu He Glu Leu Gly Pro Ser Tyr Arg Arg He Gin Arg He His 
2085 2090 2095 

Phe Gly Glu Gin Glu Ala Leu Ala Ala He Asp Ser Ala Thr Pro Leu 
2100 2105 2110 

Asn Pro Arg Cys Glu Leu Ala Glu Ala Gly Leu Gin Leu Leu Ser Ala 
2115 2120 2125 

Ala Ala Ser Pro Ala Leu Ala Asp Gly Ala Glu His Pro He Phe Ala 
2130 2135 2140 
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Pro Leu Gly He Asp Arg Val Cys Phe Tyr Gly Ser Leu Glu Gly Ala 
2145 2150 2155 2160 

Val Trp Gly Ala Ala Gin He Leu Arg His Ser Pro Asp Gly Phe Thr 
2165 2170 2175 

Gly Glu Ala Gin Leu Leu Asp Ser Glu Gly Cys Val Leu Gly Glu Leu 
2180 2185 2190 

Gin Gly Val Ser Phe Arg Arg Val Thr Arg Ala Trp Ala Gin Arg Ser 
2195 2200 2205 

Glu Arg Lya Pro Glu Leu Tyr Glu Val Glu Trp Arg Pro Glu Pro Leu 
2210 2215 2220 

Arg Gin Pro Ser Arg Thr Leu Gin Pro Gly Ala Trp Leu He Leu Ala 
2225 2230 2235 2240 

Asp Ser Gly Gly Ala Ala Arg Ala Leu Ala Asp Ala Leu Thr Ala Gin 
2245 2250 2255 

Gly Glu Met Cys Val Thr Val Pro Pro Ala Gly Glu Tyr Met Ser Leu 
2260 2265 2270 

Val Gly Glu Arg Asp Trp Arg Gly He Val Asn Leu Tyr Ser Leu Asp 
2275 2280 2285 

Asp Tyr Glu Leu Gly Cys Arg Ser Thr Leu Ala Leu Val Lys Ser Leu 
2290 2295 2300 



Lys Ser Gly Pro Arg Leu Trp Leu 
2305 2310 

Ser Ala Val His Asn Pro Met Gin 
2325 



Val Thr Ala Gly Ala Gin Ala Thr 
2315 2320 

Ala Ala Leu Trp Gly Phe Gly Arg 
2330 2335 



Val He Ala Arg Glu His Pro Asp Leu Trp Gly Gly Leu He Asp Leu 
2340 2345 2350 

Asp Pro Asp Asp Ala His Ala Ser Ala Ala Gly Ala Ala Ala Gin Met 
2355 2360 2365 

Arg Asp Phe Asp Gly Glu Asp Gin Ser Ala Trp Arg Ser Asn Arg Arg 
2370 2375 2380 

Tyr Val Pro Arg Leu Thr Arg Arg Pro Ser Ala Arg Ala Ala Val Arg 
2385 2390 2395 2400 



Leu Val Ser Gly Ala Thr Tyr Leu He Thr Gly Gly Leu Gly Ala Leu 
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2405 



2410 



2415 



Gly Leu Thr Val Ala Lys Trp Met Val Glu His Gly Ala Thr Arg Val 
2420 2425 2430 

Val Leu Ala Gly Arg Arg Pro Pro Asn Glu Glu Gin Gin Arg Val Leu 
2435 2440 2445 

Gin Gin He Gly Ala Thr Ala Glu Thr Val Asp Val Ser Arg Glu Glu 
2450 2455 2460 

Glu Val Ala Asp Leu He Arg Arg He His Thr Glu Thr Ser Pro Leu 
2465 2470 2475 2480 

Arg Gly Val He His Ala Ala Gly Val Leu Asp Asp Gly Val Leu Leu 
2485 2490 2495 

Asn Gin Asp Trp Thr Arg He Ala Ser Val Met Ala Pro Lys Ala Glu 
2500 2505 2510 

Gly Ala Val His Leu His His His Thr Arg Asp Leu Pro Leu Asp Phe 
2515 2520 2525 

Phe Val Leu Phe Ser Ser Ala Ser Ser Leu Leu Gly Pro Ala Gly Gin 
2530 2535 2540 

Ala Gly Tyr Ala Ala Ala Asn Ala Val Leu Asp Ala Leu Ala His His 
2545 2550 2555 2560 

Arg Arg Gly Leu Gly Leu Pro Ala Thr Ser He Asn Trp Gly Arg Trp 
2565 2570 2575 

Ser Gly Ala Gly Met Ala Ala Arg Thr Ser Gin Ser Met Ala Gly Val 
2580 2585 2590 

Ala Ser Leu Ser Val Asp Glu Gly Leu His He Leu Glu Ala Val Leu 
2595 2600 2605 

His Glu Cys Pro He Gin He Ala Ala Leu Pro Ala Gly Ser He Thr 
2610 2615 2620 

Gly Glu Leu Leu Arg Pro Ala Ala Leu Pro Ser Pro Gin Leu Arg Thr 
2625 2630 2635 2640 

Arg Leu Asn Glu Ala Thr Pro Arg Gin Arg Glu Ala He Leu He Ala 



2645 



2650 



2655 



His He 



Arg Glu Ser Leu Ala Arg Phe Val Gly He 
2660 2665 



Ala Thr Ser Thr 
2670 
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Pro Leu Asp Pro Gin Gin Pro Leu Gly Glu Leu Gly Leu Asp Ser Leu 
2675 2680 2685 

Met Ala lie Glu Leu Arg Asn Ser Leu Ser Gin Ser Leu Gly Gin Pro 
2690 2695 2700 

Leu Pro Ala Ser Leu Leu Phe Asp Tyr Pro Ser Leu Asp Ala lie Val 
2705 2710 2715 2720 

Ser Tyr Val Leu His Ala Val Phe Pro Pro Glu Ala Ser Pro Val Glu 
2725 2730 2735 

Ala Pro Glu Phe Glu Asn Leu Ala Arg Glu Glu Leu Glu Ala Leu Leu 
2740 2745 2750 

Asp Ser Arg Leu Ala Gin Val Asp Gin Trp Leu Glu Thr Gin 
2755 2760 2765 



<210> 123 
<211> 1763 
<212> PRT 
<213> bacterie 

<400> 123 

Met Ser Gly Ser Asp Asp Leu Ser Lys Leu Arg Arg Ala Val lie Ala 
15 10 15 

Leu Asp Lys Val Gin Lys Arg lie Asp Gin Leu Glu Ser Ala Arg Ser 
20 25 30 

Glu Pro He Ala Leu He Gly Ala Gly Cys Arg Phe Pro Gly Ala Ser 
35 40 45 

Asn Leu Asp Ala Tyr Trp Ser Leu Leu Arg Glu Gly Arg Ser Ala Val 
50 55 60 

Arg Glu Val Pro Pro Asp Arg Trp Asp He Asp Ala Tyr Tyr Asp Pro 
65 70 75 80 

Asp Pro Gly Ala Thr Gly Arg Met Tyr Thr Arg Tyr Gly Gly Phe He 
85 90 95 

Asp Gin Val Asp Arg Phe Asp Ala Arg Phe Phe Gly He Ala Pro Arg 
100 105 110 



Glu Ala 



He Ser Leu Asp Pro Gin Gin Arg Leu Leu 
115 120 



Leu Glu Val Thr 
125 
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Trp Glu Ala lie Glu Asn Ala Gly Leu Pro Pro Asp Arg Leu Ala Gly 
130 135 140 

Ser Arg Thr Gly Val Phe Met Gly lie Phe Ser Asn Asp Tyr Tyr Asn 
145 150 155 160 

Leu Gin Met Arg Gly Gly Asp Ala His lie Asp Ala Tyr Thr Gly Thr 
165 170 175 

Gly Asn Thr Ala Ser Val Ala Ala Gly Arg Leu Ser Tyr lie Leu Gly 
180 185 190 

Leu Gin Gly Pro Asn Met Ala He Asp Thr Ala Cys Ser Ser Ser Leu 
195 200 205 

Val Ala Val His Leu Ala Cys Gin Ser Leu Arg Ser Gly Glu Ser Asp 
210 215 220 

Leu Ala Leu Ala Gly Gly Val Asn Leu He Leu Ser Pro Asp Arg Thr 
225 230 235 240 

He Tyr Phe Cys Lys Leu Lys Ala Met Ala Ala Asp Gly Arg Cys Lys 
245 250 255 

Ala Phe Asp Ala Ala Ala Asp Gly Tyr Val Arg Gly Glu Gly Cys Gly 
260 265 270 

Val Val Val Leu Lys Arg Leu Ser Asp Ala Leu Arg Asp Arg Asp Pro 
275 280 285 

Val Met Ala Val He Arg Gly Thr Ala He Asn Gin Asp Gly Arg Ser 
290 295 300 

Asn Gly Leu Thr Ala Pro Asn Gly Pro Ala Gin Glu Ala Val He Arg 
305 310 315 320 

Gin Ala Val Gly Asp Ala Arg Leu Gin Thr Leu Asp Val Ser Tyr Val 
325 330 335 

Glu Ala His Gly Thr Gly Thr Pro Leu Gly Asp Pro He Glu Ala Gly 
340 345 350 

Ala Leu Ala Ala Ala Leu Gly Ala Gly Arg Thr Asn Gly Asn Lys Leu 
355 360 365 

Lys Leu Gly Ser Val Lys Thr Asn Phe Gly His Leu Glu Ala Ala Ala 
370 375 380 



Gly Val Ala Ala Leu He Lys Val Ala Leu Met Leu Gin Asn Glu Ala 
385 390 395 400 
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lie Pro Pro His Leu Asn Leu Thr Thr Pro Ser Pro His lie Asp Trp 
405 410 415 

Asn Thr Leu Pro Leu Glu lie Pro Ala Arg Leu Thr Pro Trp Pro Val 
420 425 430 

Ala Pro Gly Gly Arg Arg Val Ala Gly He Asn Ser Phe Gly Leu Ser 
435 440 445 

Gly Thr Asn Ala His Val Leu He Glu Gin Ala Pro Gin Gin Ala Ala 
450 455 460 

Ser Ser Thr Pro Ala Pro Tyr Leu Leu Pro Leu Ser Ala Arg Ser Pro 
465 470 475 480 

Glu Ala Leu Arg Asp Leu Ala Arg Ala Tyr Arg Asp Val Val Asn Asp 
485 490 495 

Asn Pro Ala Asp Thr Cys Tyr Thr Ala Cys Ala Arg Arg Thr Ser Tyr 
500 505 510 

Glu His Arg Ala Ala Phe Thr Gly Thr Asn Ala Gin Asp Leu Met Ala 
515 520 525 

Gly Leu Asp Ser Phe Leu Ala Gly Asn Pro Asn Arg Asp Thr Ala Thr 
530 535 540 

Gly Phe Val Pro Arg Gly Gin Lys Arg Lys Val Val Phe Val Leu Pro 
545 550 555 560 

Gly Gin Gly Ser Gin Trp Pro Gly Met Gly Arg Asp Leu Met Ala Ser 
565 570 575 

Glu Pro Val Phe Arg Ala Ala He Glu Glu Cys Gly Arg Ala Met Gin 
580 585 590 

Pro Tyr Val Asp Trp Ser Leu Thr Gin Glu Leu Gin Gly Pro Leu Asp 
595 600 605 

Arg He Asp Val He Gin Pro Ala Leu Phe Ala Val Gly Val Ala Leu 
610 615 620 

Ala Gly Leu Trp Arg His Trp Gly He Glu Pro Asp Ala Val He Gly 
625 630 635 640 

His Ser Met Gly Glu Val Ala Ala Ala His He Ala Gly Ala Leu Thr 
645 650 655 



Leu Asp Glu Ala Ala Arg Val He Cys Leu Arg Ser Arg Met Leu Ala 
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660 



665 



670 



Gly Val Arg Gly Gin Gly Glu Met Ala Val Val Glu Leu Ala Leu Asp 
675 680 685 

Glu Ala He Ala Ala He Ala Gly Arg Ser Asp Arg Val Ser He Ala 
690 695 700 

Ala Ser Asn Ser Pro Arg Ser Thr Val Leu Ser Gly Asp Ser Ala Ala 
705 710 715 720 

Leu Gly Glu Leu Leu Arg Glu Leu Glu Ala Lys Asp Val Phe Cys Arg 
725 730 735 

Arg Val Lys Val Asp He Ala Ser His Ser His Leu Met Asp Ser Val 
740 745 750 

Cys Ala Ala Leu Pro Gly Val Val Gly Ala Leu Gin Pro Arg Pro Ala 
755 760 765 

Ala Leu Gly Met Tyr Ser Thr Val Thr Gly Ala Ala He Ser Gly Glu 
770 775 780 

Glu Leu Val Ser Ala Tyr Trp Ala Arg Asn Leu Arg Gin Pro Val Met 
785 790 795 800 

Leu Ser Thr Ala Val Ala Ala Ala Ala Ala Gly Gly His Asp Val Phe 
805 810 815 

Leu Glu Leu Ser Pro His Pro Leu Leu Val Gin Pro He Gin Glu Thr 
820 825 830 

Leu Gly Asp Arg Ala Ala He Ala Ala Ala Ser Leu Arg Arg Asp Glu 
835 840 845 

Asp Gly Asn Leu Ala Leu Arg Arg Thr Leu Gly Ala Leu Leu Thr Asn 
850 855 860 

Gly Val Thr Pro Asp Trp Ser Arg He Tyr Pro Asn Gly Gly Gin Thr 
865 870 875 880 

Arg Arg Leu Pro Asn Tyr Pro Trp Gin Arg Glu Arg Tyr Trp He Asp 
885 890 895 

He Arg Pro Pro Gin Val Glu Ser Gin Ala Leu Pro Gly Arg Arg He 



900 



905 



910 



Pro Ser Pro Leu Pro Glu Met Gin Phe Glu Ser Thr Val Glu Ala Lys 
915 920 925 
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Asp Phe Ala Asp His Arg Leu His Asp Val He Val Thr Pro Gly Ala 
930 935 940 

Trp His Leu Ala Met Ala Leu Ala Ala Ala Arg Gin Gly Leu Gly Ala 
945 950 955 960 

Gly Pro His His Val Glu His Val Ser Leu Thr Gly Ala Leu Thr Leu 
965 970 975 

Pro Glu Asn Asp Ala Ala Arg Gin Val Gin Leu Val Leu Arg His Glu 
980 985 990 

Glu Gly Gly Gly Ala Ser Phe Arg lie Tyr Ser Arg Glu Asp Ser Trp 
995 1000 1005 

Lys Leu His Ser Glu Gly Met Leu Gin Ala Gly Asp Ser Thr Ala Ser 
1010 1015 1020 

He Asp Leu Asp Ala He Arg Ala Arg Cys Thr Ala Glu Leu Thr Ala 
1025 1030 1035 1040 

Asp Ala Phe Tyr Ser Arg Leu Trp Asp Arg Gly Tyr His Phe Gly Pro 
1045 1050 1055 

Thr Phe Arg Thr He Gly Pro He Trp Arg Gly Asn Gly Glu Val Leu 
1060 1065 1070 

Cys Arg Val Asp He Pro Leu Thr Glu Met Gin Thr He Asp Cys Cys 
1075 1080 1085 

Leu Gin Leu Pro Ala Ala Leu Val His His Asp Asp Leu Lys Asp Val 
1090 1095 1100 

His Val Pro Val Gly Leu Asp Arg Phe Ser Leu Ala Glu Val Pro Thr 
1105 1110 1115 1120 

Gly Pro Val Trp Gly Tyr Ala Val Leu Arg Pro Asp Ser Thr Val Asp 
1125 1130 ■ 1135 

Val Arg Leu Val Thr Gly Thr Gly Ser Val Val Ala Glu Leu Val Gly 
1140 1145 1150 

Leu Gin Ser Arg Val Ala His Ser Gly Gin Leu Gly Glu Ser Glu He 
1155 1160 1165 

Pro Thr Trp Thr Val Gin Trp Thr Ala Ser Val Arg Arg Gly Asp Ala 
1170 1175 1180 



Asn Ala Gly Asn Ala Gly Gly Pro Trp Leu Val He Gly Glu Pro Ala 
1185 1190 1195 1200 
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He Ala Glu Thr Leu Gin Lys Arg Gly Gin Thr Cys Arg Thr Ala Asp 
1205 1210 1215 

Thr Cys Ser Gly Pro Pro Cys Arg Gin He Val Tyr Cys Pro Ser Pro 
1220 1225 1230 

Arg He Asp Asp Leu Leu Ser Val Leu Arg Ser He Val Gin Ala Gly 
1235 1240 1245 

Trp Pro Glu Pro Pro Arg Leu Trp Leu Leu Thr Arg Gly Ser Ala Ala 
1250 1255 1260 

Val Leu Asn Ser Asp Lys Asp He Asp He Arg Gin Ala Trp Leu His 
1265 1270 1275 ■ 1280 

Gly He Gly Arg Thr He Ala Tyr Glu His Pro Glu Leu Arg Cys Thr 
1285 1290 1295 

Leu Val Asp Leu Asp Ala His Ser Asn Asp Cys Gly His Leu Ala Thr 
1300 1305 1310 

Leu Met Leu Ser Asn He Ala Glu Asp Gin Val Ala He Arg Gin Gly 
1315 1320 1325 

Thr Val Trp Ala Pro Arg Leu Ser Leu His Lys He Pro Ser Ala Pro 
1330 1335 1340 

Asp Val Ala Phe Arg Ala Asp Ala Thr Tyr Leu He Thr Gly Gly Leu 
1345 1350 1355 1360 

Gly Gly Leu Gly Leu Gin Val Ala Gly Trp Leu Ala Ala Ala Gly Ala 
1365 1370 1375 

Arg His Leu Val Leu Leu Gly Arg Ser Glu Arg Pro Arg Pro Gin Leu 
1380 1385 1390 

Glu Gly Val Asn Val Lys He He His Ala Asp Val Ala Asp Arg Gin 
1395 1400 1405 

Gin Leu Ser Asp Ala Leu Ala He He Asp Arg Asp Met Pro Pro Leu 
1410 1415 1420 

Arg Gly Val Phe His Leu Ala Gly Thr Leu Ala Asp Gly Met Leu Leu 
1425 1430 1435 1440 

Asn Leu Thr Thr Glu Arg Phe Glu Ala Ala Met Ala Pro Lys Val Ala 
1445 1450 1455 



Gly Ala Trp Asn Leu His Glu Leu Thr Ala Gly Arg Pro Leu Asp His 
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1460 1465 1470 

Phe Val Leu Phe Ser Ser Ala Ser Ala Thr Val Gly Ser Pro Gly Gin 
1475 1480 1485 

Gly Asn Tyr Ala Ala Gly Asn Ser Phe Leu Asp Ala Leu Ala His Leu 
1490 1495 1500 

Arg Arg Ala Gin Gly Leu Pro Ala Val Ser He Ala Trp Gly Pro Trp 
1505 1510 1515 1520 

Thr Gin Val Gly Leu Ala Ala Gin Ala Asn Arg Gly Asp Arg Leu Ala 
1525 1530 1535 

Ala Arg Gly He Ser Val lie Gin Pro Gin Gin Gly Leu Arg Ala Leu 
1540 1545 1550 

Tyr Lys Ala Leu Thr Gin He Arg Pro His Val Ala Val Met Asn Phe 
1555 1560 1565 

Asp He Ala Gin Trp Leu Arg Tyr Tyr Pro Ser Ala Ala Ser Met Ser 
1570 1575 1580 

Leu Leu Ala Gly He Ala Pro Ala Ala Ala Asp Thr Lys Pro Ala Ala 
1585 1590 1595 1600 

Asp Met Arg Ser Glu Leu Leu Ala Val Pro Ala Gly Arg Gin Arg Arg 
1605 1610 1615 

Ala Arg Leu Glu Thr Leu Leu Met His Glu Ala Gly His Val Leu Arg 
1620 1625 1630 

Phe Asp Pro Ala Lys Leu Asp Gly Arg Ala Thr Leu Gly Asp Leu Gly 
1635 1640 1645 

Phe Asp Ser Leu Met Ala Leu Glu Phe Arg Asn Arg Leu Glu Ala Gly 
1650 1655 1660 

Leu Arg Val Lys Leu Ser Ala Thr Leu He Trp Arg Tyr Pro Thr Phe 
1665 1670 1675 1680 

Ser Ala Leu Ala Gin His Leu Ala Asp Lys Leu Gly Leu Pro Leu Glu 
1685 1690 1695 

Ser Met Ala Gly Asn Ala Glu Pro Ser Thr Val Ala Ala Val Ala Thr 
1700 1705 1710 

Leu Ala Thr Val Gly Thr Ala Ala Gly Glu Asp Arg Ser Pro Ala Ala 
1715 1720 1725 
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Ala Asp Asp Leu Asp Ala Val Ala Asn Gin lie Ala Gly Leu Gly Asp 
1730 1735 1740 

Lys Glu lie Glu Ala Leu Leu Lys Gin Lys Phe Ala His Phe Ser Gly 
1745 1750 1755 1760 

Ala Ser Glu 



<210> 124 
<211> 2153 
<212> PRT 
<213> bacterie. 

<400> 124 

Met Ser Ser He Ser Glu Arg Phe Pro Asn Leu Thr Pro Leu Gin Gin 
15 10 15 

Ala Tyr Leu Thr Leu Glu His Met Gin Arg Arg Leu Asp Ala Ala Glu 
20 ,25 30 

Arg Asp Ala Arg Glu Pro He Ala He Val Gly Leu Gly Cys Arg Phe 
35 40 45 

Pro Gly Gly Asp Gly Pro Aap Glu Phe Trp Gin Met Leu Arg Ser Gly 
50 55 60 

Val Asp Ala He Arg Glu Val Pro Pro Gly Arg Trp Asp Glu Glu Ser 
65 70 75 80 

Val Arg Arg He Leu Lys Ser Leu Asn Pro Ala Thr Pro Val Lys He 
85 90 95 

Gin Ala Gly Phe Leu Asp Ser He Asp Gly Phe Asp Asn Asp Phe Phe 
100 105 110 

Gly He Ser Pro Arg Glu Ala Val Ser He Asp Pro Gin Gin Arg Leu 
115 120 125 

Leu Leu Glu Val Ala Trp Glu Ala Leu Glu Asp Ala Gly Gin Thr Met 
130 135 140 

Glu Gly Leu Ser Gly Ser Arg Thr Gly Val Phe Val Gly He His Ser 
145 150 155 160 

Gin Ser Ser Asp Tyr Phe Trp Met Gin Thr Ala Asp Gly Ala Arg He 
165 170 175 
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Asp Pro Tyr Thr Ala Thr Gly Thr Ala His Ser Val He Ala Gly Arg 
180 185 190 

Leu Ser Tyr Leu Leu Asn Leu Gin Gly Pro Ser He Ala Leu Asp Thr 
195 200 205 

Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Cys Gin Ser Leu 
210 215 220 

Arg Ser Gly Glu Cys Thr Leu Ala Val Ala Gly Gly Val Asn Leu Arg 
225 230 235 240 

Phe Ser Pro Glu Phe Met Tyr Ala Thr Ser Lys Met Gly Thr Ala Ser 
245 250 255 

Pro Ser Gly Arg Cys Arg Ala Phe Asp Ala Ala Ala Asp Gly He Val 
260 265 270 

Phe Gly Glu Gly Cys Gly Val Val Val Leu Lys Arg Leu Ser Asp Ala 
275 280 285 

Leu Ala Ala Gly Asp Arg Val Trp Ala Val Val Arg Gly Ser Ala Val 
290 295 300 

Asn Gin Asp Gly Arg Ser Ala Gly Leu Thr Ala Pro Asn Val Val Ser 
305 310 315 320 

Gin Gin Val Val He Arg Ser Ala Leu Ala Asn Ala Gly Val Ala Ala 
325 330 335 

Gin Gin He Gly Tyr He Glu Ala His Gly Thr Gly Thr Pro Leu Gly 
340 345 350 

Asp Pro He Glu He Glu Ala Leu Ala Glu Thr Val Gly Leu Pro Arg 
355 360 365 

Pro Val Gly Asp Val Cys Ala Val Gly Ser Leu Lys Ser Asn He Gly 
370 375 380 

His Leu Glu Gly Ala Ala Gly He Ala Gly Leu He Lys Ala Val Leu 
385 390 395 400 

Ala Leu Ser His Glu Thr He Pro Pro Ser Leu His Val Arg Gin Leu 
405 410 415 

Asn Pro Asn He Arg Leu Glu Gly Thr Ser Leu Asp He Val Lys Glu 
420 425 430 



Val Arg Pro Trp Pro Ala Gly Ser Arg Arg Arg Phe Ala Gly Val Ser 
435 440 445 
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Ala Phe Gly Trp Ser Gly Thr Asn Ala His Val Val Leu Glu Glu Ala 
450 455 460 



Ala Pro Thr Gly Arg Gly Glu Ala Ala Ser Gly Phe His Ser Arg Pro 
465 470 475 480 



Pro Ala Ala Ala Ala Arg Ala Ala Val Pro Leu Ala Glu Gly Asp Thr 
485 490 495 



Gly Gly Thr Pro Asp lie Ala Gly Thr Pro Asp Thr Ala Asp Thr Pro 
500 505 510 



Asp Thr Ala Asp Thr Pro Asp He Ala Gly Thr Ala Gly Thr Ala Ala 
515 520 525 



Thr Thr Gly He Ala Asp Ala Met Tyr Val Leu Pro Leu Ser Ala His 
530 535 540 



Gly Ala Asp Glu Leu Arg Arg- Val Ala Arg Ala Tyr Gly Glu Leu Leu 
545 550 555 560 



Thr Ala Ser His Ala Pro Ser Leu Arg Asp Leu Cys Tyr Thr Ala Ala 
565 570 575 



Val Arg Arg Thr His His Arg Cys Arg Leu Ala Val Ser Gly Arg Thr 
580 585 590 



Ala Glu Glu Leu Ala Ala Gin Leu Gin Gly He Thr He Pro Ser Gin 
595 600 605 



Arg Arg Lys Thr Val Phe Val Phe Ser Gly Gin Gly Ser Gin Trp He 
610 615 620 



Gly Met Gly Arg Ser Trp Met Asp Arg Glu Pro Val He Arg Glu Ala 
625 630 635 640 



Leu Glu Arg Cys Glu Ala Ala Met Arg Pro Tyr Val Asp Trp Ser Leu 
645 650 655 



Lys Glu Glu Leu Ala Lys Leu Asp Arg Val Glu Val He Gin Pro Ala 
660 665 670 



Leu Phe Ala Leu Gin Val Ala He Ala Ala Leu Trp Arg Ser Trp Gly 
675 680 685 



He Glu Pro Asp Ala Val He Gly His Ser Met Gly Glu Val Ala Ala 
690 695 700 



Ala His Val Ala Gly Ala Leu Thr Leu Gin Asp Ala Ala Arg He He 



wo 01/40497 



PCT/FROO/03311 



129 



705 



710 



715 



720 



Cys Ser Arg Ser Arg Leu Leu Ser Arg lie Ser Gly Leu Gly Gly Met 
725 730 735 

Ala Met Val Glu Leu Pro Leu Ala Glu Cys Glu Ala Val Leu Ser Thr 
740 745 750 

Tyr Thr Glu Arg Leu Ser Pro Ala Val Ser Asn Gly Pro Asn Ser Thr 
755 760 765 

Val He Ser Gly Glu Val Glu Ala Leu Ala Glu Val Val Ala Thr Leu 
770 775 780 

Glu Arg Arg Gly Val Ser Cys Arg Pro Val Lya Val Asp Phe Ala Ala 
785 790 795 800 

His Ser Pro Gin Val Asp Pro Leu Cys Asp Glu Leu Leu Gin Ser Leu 
805 810 815 

Asp Gly He Gin Pro Arg Pro Ala Thr He Pro Phe Tyr Ser Thr Val 
820 825 830 

Thr Gly Ala Thr Leu Glu Thr Thr Ser Leu Asp Ser Thr Tyr Trp Ala 
835 840 845 

Arg Asn Leu Arg Ser Pro Val Leu Phe Trp Gin Gly He Arg His Leu 
850 855 860 

Ala Asp Ser Gly His Asp Val Phe Leu Glu He Ser Pro His Pro He 
865 870 875 880 

Leu Leu Pro Ala He Gly Gly Asn Ala Ala Leu Val Pro Ser Leu Arg 
885 890 895 

Arg Asp Gin Asp Glu Arg Gly Ser Met Leu Thr Ser Leu Gly Ala Leu 
900 905 910 

Tyr Glu Ala Gly His Thr Val Ala Trp Arg Thr Val Tyr Pro Ser Gly 
915 920 925 

Asn Cys Val Arg Leu Pro Arg Tyr Pro Trp Gin Arg Arg Arg Phe Trp 
930 935 940 

Leu Asp Ala Ser Pro Ala Arg His Ala He Thr Leu Gly Asn Pro Leu 
945 950 955 960 

Leu Gly Lys Arg Val Glu Ala Ser Thr Gin Pro Gly Thr Phe Phe Trp 



965 



970 



975 
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Glu Thr Glu Leu Ser Leu Ala Ser Val Pro Trp Leu Ala Asp His Arg 
980 985 ' 990 

Val Gin Gly Glu Val Val Leu Pro Ala Thr Ala Tyr Leu Asp Met Ala 
995 1000 1005 

Leu Ala Gly Thr Ser Glu Thr Phe Gly Glu Ser Pro Cys Val Leu Glu 
1010 1015 1020 

His Val Thr Phe Thr Gin Met Leu He Val Pro Arg Asp Gly Ser Met 
1025 1030 1035 1040 

Thr Leu Gin Leu Ala He Ala Val Asp Arg Pro Gly Met Ala Ser Phe 
1045 1050 1055 

Arg He Ser Ser Arg Gin Ala Ser Thr Trp Val Leu His Ala Ser Gly 
1060 1065 1070 

Asp He Arg Gin Thr Pro Ala Asp Ala Ser Thr Val Pro Pro Asp Ser 
1075 1080 1085 

Ala Glu Thr Val Gin Ala Arg Cys Pro Thr Val Val Pro Ala Ala Glu 
1090 1095 1100 

Leu Trp Arg Gin Met Ala Glu His Gly Val Glu Tyr Gly Pro Ala Phe 
1105 1110 1115 1120 

Arg Ala Leu Glu Gin He Trp Ser Cys Pro Gly Glu Ala He Gly Arg 
1125 1130 1135 

Leu Arg Ser Ser Glu Thr Arg Ser Thr Ala Pro Ala Phe Leu Asp Ala 
1140 1145 1150 

Cys Leu Gin He He Ala Ala Ala Phe Gly Pro Ala Gly Gly Thr Trp 
1155 1160 1165 

Leu Pro Ala Gly He Asp Arg Met Arg Trp Leu His Pro Ala Arg Ser 
1170 1175 1180 

Val Val Trp Thr His Ala Arg Leu Glu Gly Pro He Ala Asp Leu Ser 
1185 1190 1195 1200 

Leu Leu Asp Gly Glu Gly Gin Leu Val Ala Arg He Glu Gly Leu Arg 
1205 1210 1215 

Leu Gin Arg Leu Asp Ala Ser Glu Arg He Asp Met Arg Gly Trp Leu 
1220 1225 1230 

His Glu Leu Arg Trp Val Ala Gin Pro His Ala Ala Ala Glu Pro Pro 
1235 1240 1245 
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Ala Ala Arg Ala Ala Arg Ser Trp Leu He Val Gly Ala Val Asp Ser 
1250 1255 1260 

Ala Leu Thr Ala Trp Leu Arg Ala Thr Gly Asn Arg Val Thr Gin Thr 
1265 1270 1275 1280 

Ser Pro Glu Lys Leu Asp Glu Leu Gin Pro Pro Leu Glu Glu He Val 
1285 1290 1295 

Phe Leu Leu Glu His Glu Pro Ser Cys Asp Arg He Leu His Leu Leu 
1300 1305 1310 

Gin Thr Leu Gly Arg Thr Pro Trp Arg Gin Ala Pro Arg Leu Trp Leu 
1315 1320 1325 

Val Thr Arg Gly Ala Gin Pro Val Asp Gly Gin He Leu Gin Ala Gly 
1330 1335 1340 

He Ala Gin Ala Pro Phe Trp Gly Leu Gly Arg Thr Val His Tyr Glu 
1345 1350 1355 1360 

His Pro Glu Leu Asn Cys Thr Leu He Asp Leu Asp Pro Ala Gly Gly 
1365 1370 1375 

Glu Glu Glu Leu Leu His Glu Leu Leu Thr Asn Asn Gly Glu Asn Gin 
1380 1385 1390 

He Ala Phe Arg Gly Gly Ala Arg Tyr Val Ala Arg Val Ala Arg His 
1395 1400 1405 

Glu Ala Asp Met Gin Pro Ala Met Phe Lys Ala Gly Asp Arg Pro Phe 
1410 1415 1420 

Arg Leu Glu He Asp Ala Pro Gly Val Leu Asp Arg Leu Arg Leu Arg 
1425 1430 1435 1440 

Ala Thr Ser Arg Arg Pro Pro Gin Ala Gly Glu Val Glu He Glu Val 
1445 1450 1455 

Cys Ala Ala Gly Leu Asn Phe Leu Asp Val Leu Leu Ala Leu Gly Val 
1460 1465 1470 

Met Pro Asp Asp Ala Pro Gly Ala He Ala Gly Ser Pro Arg Leu Gly 
1475 1480 1485 

Gly Glu Cys Ser Gly Arg He Val Ala Met Gly Lys Gly Val Thr Asp 
1490 1495 1500 

Phe Arg He Gly Asp Glu Val Val Ala Leu Ala Pro Cys Ser Phe Gly 
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Arg Phe Val Thr Thr Pro Ala Phe Arg Val Ala Leu Lys Pro Ala Asn 
1525 1530 1535 

He Pro Ala Glu Gin Ala Ala Ala Leu Pro He Ala Phe Leu Thr Ala 
1540 1545 1550 

Asp Tyr Ala Leu Ser Arg Ala Ala Arg Leu Ala Pro Gly Glu Arg Val 
1555 1560 1565 

Leu He His Ala Ala Thr Gly Gly Val Gly Leu Ala Ala He Gin He 
1570 1575 1580 

Ala Gin Arg Ala Gly Ala Glu He .Phe Ala Thr Ala Gly Ser Pro Glu 
1585 1590 . 1595 1600 

Lys Arg Ala Tyr Leu Arg Ser Leu Gly He Ala His Val Ser Asp Ser 
1605 1610 1615 

Arg Ser Met Ala Phe Val Asp Asp He Arg Asn Trp Thr Asn Gin Glu 
1620 1625 1630 

Gly Val Asp Val Val Leu Asn Ser Leu Ser Gly Asp Leu Leu Glu Ala 
1635 1640 1645 

Ser Phe Asp Leu Leu Arg Asp His Gly Arg Phe He Glu He Gly Lys 
1650 1655 1660 

Arg Asp Tyr Tyr Ala Gly Arg Lys Leu Gly Leu Arg Pro Phe Leu Lys 
1665 1670 1675 1680 

Asn Leu Ser Tyr Thr Leu Val Asp Leu Leu Gly Met Ser Leu Lys Arg 
1685 1690 1695 

Pro Ala Leu Thr Arg Glu Leu Leu Gin Glu Met Val Ala Lys Phe Glu 
1700 1705 1710 

Ser Glu Thr Trp Arg Pro Leu Glu Thr Arg Val Thr Thr He Thr Glu 
1715 1720 1725 

Ser Val Glu Ala Phe Arg Thr Met Ala Gin Ala Arg His He Gly Lys 
1730 1735 1740 

He Val Met Ala Met Arg Asp Cys Ala Asn Ala Pro He Ala Pro Leu 
1745 1750 1755 1760 

Arg Ser Ala Phe Asp Ser Glu Gly Thr Tyr Leu He Thr Gly Gly Leu 
1765 1770 1775 
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Gly Gly Leu Gly Leu Thr Val Ala Arg Trp Met lie Gly Arg Gly Ala 
1780 1785 1790 

Arg Arg Leu Val Leu Leu Ser Arg Arg Ala Pro Ser Pro Glu Val Gin 
1795 1800 1805 

Gin Ala He Ala Val Met Asp Ala Asp Val Arg Thr Val Gin Ala Asp 
1810 1815 1820 

Val Ser Gin Arg Asp Glu Leu Glu Arg Val life Ser Ser lie Asp Arg 
1825 1830 1835 1840 

' Leu Arg Gly Val He His Ala Ala Ala Val Leu Asp Asp Ala Leu Leu 
1845 1850 1855 

Leu Asn Gin Thr Glu Ala His Phe Arg Asn Val Met Ala Ala Lys He 
1860 1865 1870 

Asp Gly Ala Trp Asn Leu His Leu Leu Thr Arg Asp Cys Pro Leu Asp 
1875 1880 1885 

His Phe Val Leu Phe Ser Ser Ala Ala Gly Leu Leu Gly Ala Pro Ala 
1890 1895 1900 

Gin Gly Asn Tyr Ala Ala Ala Asn Ala Phe Leu Asp Ala Leu Ala Tyr 
1905 1910 1915 1920 

Tyr Arg Lys Ala Gin Gly Leu Pro Ala Leu Ser He Gly Trp Gly Ala 
1925 1930 1935 

Trp Ser Glu Val Gly Leu Ala Ala Ala Gin Asp Asn Arg Gly Ser Arg 
1940 1945 1950 



Leu Ala Leu Arg Gly Met Glu Asn Leu Thr Pro Gin His Gly Leu Ala 
1955 1960 1965 

He Leu Glu Gin Leu Leu Asn Ser Ser Ala Cys His Val Ala Ala Met 
1970 1975 1980 

Pro He Asn Val Arg Gin Trp Arg Gin Phe Tyr Pro Lys Ala Ala Gin 
1985 1990 1995 2000 

Ser Ala Leu Phe Glu Leu Leu His Asp Asp Ala Ala Ser Glu Ala Asp 
2005 2010 2015 

Ala Pro Asn Ala Leu Arg Ala Arg Leu Gin Ser Ala Glu Pro Gin Thr 
2020 2025 2030 



Arg Arg Thr Leu Leu Glu Glu His Leu Gin Gin Gin Leu Ala Arg Val 
2035 2040 2045 
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Leu Arg He Asp Ser Gin Thr He Asp Pro Leu Arg Pro Leu Lys Glu 
2050 2055 2060 

Leu Gly Phe Asp Ser Leu Met Ala Leu Glu Phe Arg Asn Arg Leu Glu 
2065 2070 2075 2080 

Leu Thr Leu Gly Leu Thr Leu Pro Ala Thr Leu He Trp Gly His Pro 
2085 2090 2095 

Thr Leu Ala Gly Leu Ala Pro His Leu Ala Ser Gin Met Gly Leu Pro 
2100 2105 2110 

Leu Val Glu Ala Gin Ala Ala Ala Ala Ala Glu Gly Asp Ser Arg Ala 
2115 2120 2125 

Met Lys Thr Ala Leu Ser Gly Leu Asp Asp Met Ser Glu Glu Ala Ala 
2130 2135 2140 

Val Ala Ala Leu Arg Gly Ala Arg Ser 
2145 2150 



<210> 125 
<2H> 1695 
<212> PRT 
<213> bacterie 

<400> 125 

Met Arg Glu Lys He Ala Pro Met Ser Ser Val Lys Leu Ala Leu Leu 
15 10 15 

Ala Arg Asn Met Arg Gin Asn He Ala Gly Phe Asp Leu Val His Ala 
20 25 30 

Glu Pro He Ala He Val Gly Met Ala Cys Arg Phe Pro Gly Gly Ala 
35 40 45 

Lys Asn Pro Asp Ala Phe Trp Thr Leu Leu Lys Asn Gly Val Asp Gly 
50 55 60 

Val Thr Glu Val Pro Pro Asp Arg Trp Asn Ser Asp Gin Tyr Tyr Ser 
65 70 75 80 

Ser Asp Pro Asp Ala Pro Gly Lys Ala Tyr Ala Arg Tyr Ala Ala Phe 
85 90 95 



Leu Glu Arg He Asp 
100 



Gly Phe Asp 



Ala Glu Phe Phe Gly He 
105 110 



Ser Pro 
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Arg Glu Ala Leu Asn Met Asp Pro Gin Gin Arg Leu Leu Leu Glu Val 
115 120 125 

Cys Trp Glu Ala Ala Glu Asp Ala Gly lie Ser Pro Gly Pro Leu Ala 
130 135 140 

Gly Ser Ala Thr Gly Val Phe Ala Gly Ser Cys Ala Gin Asp Phe Gly 
145 150 155 160 

Leu Phe Gin Tyr Ala Asp Pro Ala Arg lie Gly Ala Trp Ser Gly Ser 
165 170 175 

Gly Val Ala His Ser Met Leu Ala Asn Arg lie Ser Tyr Leu Leu Asp 
180 185 190 

Leu Arg Gly Pro Ser Met Ala Val Asp Thr Ala Cys Ser Ser Ala Leu 
195 200 205 

Val Ala Val His Leu Ala Cys Gin Ser Leu Arg Arg Arg Glu Cys Asp 
210 215 220 

Ala Ala Phe Ala Gly Gly Val Asn Leu He Leu Thr Pro Glu Gly Met 
225 230 235 240 

He Ala Leu Ser Lys Ala Arg Met Leu Ala Pro Asp Gly Arg Cys Lys 
245 250 255 

Thr Phe Asp Ala Ala Ala Asp Gly Tyr Val Arg Gly Glu Gly Cys Gly 
260 265 270 

He Val Leu Leu Lys Arg Leu Ser Asp Ala Leu Ala Asp Gly Asp Ala 
275 280 285 

He Arg Ala Val He Arg Gly Ser Ala He Asn Gin Asp Gly Arg Ser 
290 295 300 

Asn Gly He Thr Ala Pro Asn Leu Gin Ala Gin Lys Ala Val Leu Gin 
305 310 315 320 

Glu Ala Val Ala Asn Ala His He Asp Pro Ser His Val Ser Leu He 
325 330 335 

Glu Ala His Gly Thr Gly Thr Ser Leu Gly Asp Pro He Glu He Glu 
340 345 350 

Ala Leu Gin Ser Val Tyr Asp Ala Pro Asp Ser Ala Pro Cys Leu Leu 
355 360 365 



Gly Ser Val Lys Thr Asn He Gly His Leu Glu Gly Ala Ala Gly He 
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Ala Gly Leu lie Lys Ala Val Leu Ala Leu Gin His Arg Thr He Pro 
385 390 395 400 



Pro His Leu His Phe Arg Arg Leu Asn Pro Asn He Ser Leu Asp Gly 
405 410 415 



Ser Arg Phe Arg He Ala Thr Glu Ser Ser Pro Trp Thr Ser Glu Gly 
420 . 425 430 



Arg Pro Arg Leu Ala Gly Val Ser Ser Phe Gly Phe Gly Gly Ser Asn 
435 440 445 



Ala His Val He Leu Glu Glu Ala Pro Ala Leu Pro Leu Pro Lys Pro 
450 455 460 



Val Thr Arg Pro Gin Leu Leu Thr Leu Ser Ala Arg Thr Asp Glu Ala 
465 470 475 480 



Leu Gly Glu Leu Ala Gly His Phe Ala Glu Phe Leu Gin Ser His Pro 
485 490 495 



Asn Ala Leu Leu Ser Asp Val Cys Phe Thr Ser Gin Val Gly Arg Asp 
500 505 510 



Ala Tyr Ser His Arg Leu Ala He Thr Ala Ala Asp Ala Ala Glu Ala 
515 520 525 



Val Ala Ala Leu Ala Ala Ala Pro Arg Arg Glu Val Ser Leu Arg Arg 
530 535 540 



Arg Pro Ala He Ala Phe Leu Phe Thr Gly Gin Gly Ala Gin Tyr Ala 
545 550 555 560 



Gly Met Gly Ala Glu Leu Tyr Lys Thr Gin Pro Val Phe Arg Asp Ala 
565 570 575 



Leu Asp Arg Cys Ala Asp Trp Leu Arg Pro Gin Leu Asp Val Pro Leu 
580 585 590 



Thr Val Leu Leu Phe Glu Ser Val Ser Pro Leu His Glu Thr Ala Tyr 
595 600 605 



Thr Gin Pro Ala Met Phe Ala Leu Glu Trp Ala Leu Ala Gin Phe Trp 
610 615 620 



Leu Ser Leu Gly Val Arg Pro Asp Tyr Val Leu Gly His Ser Leu Gly 
625 630 635 640 
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Glu Tyr Val Ala Ala Cys Val Ala Gly Ala Phe Ser Val Glu Asp Gly 
645 650 655 

Leu Arg Leu Val Thr Ala Arg Gly Arg Leu Val Asn Ala Leu Pro Arg 
660 665 670 

Gly Lys Ala Val lie Val His Ala Asn Pro Ser Arg He Ala Ala Leu 
675 680 685 

Ala Ala Lys Val AJ.a Val Ala Ala Ser Asn Ala Pro Asp Arg Thr Val 
690 695 700 

He Ser Gly Thr Ala Ala Glu He Ala Glu Ala Gin Asp Asp Leu His 
705 710 715 720 

Arg Ala Gly Val Glu Thr Arg Glu Leu Asn Val Ser His Ala Phe His 
725 730 735 

Ser Pro Leu Met Asp Pro He Leu Asp Lys Phe Glu Ala Leu Ala Gly 
740 745 750 

Ala He Ala Tyr Gin Pro Leu Ala He Pro Leu Val Ser Asn Val Ser 
755 760 765 

Gly Ala Val Leu Pro Lys Gly Thr Thr Leu Asp Ala Arg Tyr Trp Arg 
770 775 780 

Arg Gin Leu Arg Glu Thr Val Gin Phe Glu Ser Ala Met Arg Thr Leu 
785 790 795 800 

Ala Asp Arg Glu Cys Lys Leu Phe Leu Glu He Gly Pro His Pro Thr 
805 810 815 

Leu Thr Thr Leu Gly Arg Tyr Cys Leu Pro Asp Asp Gly Ala Val Trp 
820 825 830 

Leu His Ser Leu Ser Lys Gly Arg Ser Asp Trp Ser Val Leu Leu Glu 
835 840 845 

Ser Leu Gly Gly Leu Phe Thr Ala Gly Val Asn Pro Asp Trp Arg Gly 
850 855 860 

Leu Tyr Ala Gly Glu Ser Pro Ser Arg Val Ala Leu Pro Thr Tyr Pro 
865 870 875 880 

Phe Gin Arg Asp Thr Phe Ser Leu Arg Arg Val Pro Ala Arg Glu Pro 
885 890 895 

Ala Arg Gly Gly Met Leu Gly Ala Arg Leu Asn Ser Ala Leu Gly Asp 
900 905 910 
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Val He Phe Glu Asn Ser Leu Thr Thr Glu Thr Pro Leu Leu His Glu 
915 920 925 

His Val He Tyr Asp Ala Val He Val Pro Gly Ala Trp His Val Ser 
930 935 940 

Ala Phe Leu Glu Ala Ala Gin Glu Val Phe Gly Pro Val Pro Cys Ala 
945 950 955 960 

Val Ser Asp Val Met Met Arg Gin Ala Leu Ala He Pro Pro Asp Thr 
965 970 975 

Pro Val Thr Val Gin Ala He Val Thr Pro Gly Glu Asp Gly Glu Ala 
980 985 990 

Lys Val Gin Val Phe Ser Gin Asp Gly Asp Ser Trp Lys Leu His Thr 
995 1000 1005 

Ala Ala Ser Leu Arg Ala Ala Thr Ala Gly Ala Val His Phe Glu Leu 
1010 1015 1020 

Pro Ala Gin Pro Ser Glu Val He Ser Gly Asp Ala Phe Tyr Gly Ala 
1025 1030 1035 1040 

Met Asn Ala Arg Gly Val Asp Leu Gly Pro Ala Phe Ser Trp Val Glu 
. 1045 1050 1055 

Glu Val Trp Arg Arg Asp Gly Glu Ala Leu Gly Arg Met Arg Leu Pro 
1060 1065 1070 

Val Ala Glu Asp Gly Ala Asn Ala Tyr Arg Leu His Pro Gly Leu He 
1075 1080 1085 

Asp Ser Cys Phe Gin Val Phe Gly Ala Thr Trp Pro Ala Glu Arg Cys 
1090 1095 1100 

Gin Pro Gly Ala Tyr Val Pro Val Gly He Glu Ala Val Arg Phe Tyr 
1105 1110 1115 1120 

Arg Pro Pro Ala Gly Ser Leu Arg Cys His Ala Arg Leu Arg Pro Ser 
1125 1130 1135 

Ser Ser Gly Pro Phe Val Gly Asp Leu Thr Leu Val Glu Glu Thr Gly 
1140 1145 1150 

Ala Val He Ala Glu Phe Ser Gly Leu Ala Val Met His Ala Gly Thr 
1155 1160 1165 

Leu Gin Ser Ala Gin Ser Trp Leu Gin Asp Val Gin Trp Gin Glu Cys 
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Glu Arg Ser Thr Thr Leu Lys Ser Asp Gly Pro Gly Lys Pro Glu Asp 
1185 1190 1195 1200 

Trp Leu Leu Cys Ala Gly Ala Asp Asp Val Ala Gly Leu Met Pro Gin 
1205 1210 1215 

Glu Leu Arg Val Val Ser Gly Val Thr Leu Arg Gin Ala Leu Glu Gin 
1220 1225 1230 

Thr Gin Thr Leu Val Gly Arg Pro Ala Arg Leu Trp Leu lie Thr Arg 
1235 1240 1245 

Gly Val His Arg lie Ser Asp .Asp Asp Ala Thr Pro Val Asp Pro Phe 
1250 1255 1260 

Gin Ala Pro Leu Trp Gly Leu Gly Gin Ala He Ala Arg Glu His Pro 
1265 1270 1275 1280 

Glu Leu Trp Gly Gly Leu He Asp Leu Gly Cys Asp Asn Ala Asp He 
1285 1290 1295 

Ala Ala Ala Met Leu Leu Asp Glu He Arg Tyr Ala Gly Asp Asp Lys 
1300 1305 1310 

Ala He Ala Leu Arg Asn Gly Arg Arg Tyr Val Arg Arg Leu Val Arg 
1315 1320 1325 

His Lys Glu Thr Ser Lys Arg Pro Pro Ala He Ser Ala Asp Gly Val 
1330 1335 1340 

Tyr Leu He Thr Gly Gly Leu Gly Ala Leu Gly Arg Arg Val Ala Arg 
1345 1350 1355 1360 

Arg Leu He Glu Gin Gly Ala Arg Arg Leu Val Leu Val Gly Arg His 
1365 1370 1375 

Thr Glu Ala Val Ala Asp Leu Glu Gin Leu Gly Ala Ala Val Met Val 
1380 1385 1390 

Ala Ala Cys Asp Val Ser Ser Glu Gin Gin Leu Ala Ala Leu Leu Ala 
1395 1400 1405 

Asp Pro Arg Thr Gin Pro Leu Arg Gly Val Val His Ala Ala Gly Val 
1410 1415 1420 

Leu Asp Asp Gly Val Val Thr Glu Gin Thr Trp Ala Arg Phe Glu Lys 
1425 1430 1435 1440 
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Val Leu Ala Pro Lys Leu Gin Gly Ala Trp Asn Leu His Gin Leu Thr 
1445 1450 1455 

Arg His His Ala Leu Asp Phe Phe Val Leu Phe Ser Ser Ala Ala Ser 
1460 1465 1470 

Leu Leu Gly Ser Ala Gly Gin Ser Asn Tyr Ser Ala Ala Asn Ala Phe 
1475 1480 1485 

Leu Asp Ser Leu Ala His Met Arg Arg Ala Gin Gly Leu Pro Ala Leu 
1490 1495 1500 

Ser He Asn Trp Gly Pro Trp Ala Gly Glu Gly Met Ala Ala Arg He 
1505 1510 1515 1520 

Ala Arg Gin Gly Leu Pro Gly Val Pro Leu Leu Pro Pro Glu Val Gly 
1525 1530 1535 

Ala Arg He Phe Gly Asp Leu Leu Gly Glu Thr Ala Ala Gin He Ala 
1540 1545 1550 

Val Phe Gin Val Ser Ala Glu Lys Arg Arg Ser Pro Ala Ser Asp Pro 
1555 1560 1565 

Gly Phe He Gin Gin Leu Thr Glu Ala Ala Pro Glu Arg Arg Gin Glu 
1570 1575 1580 

Leu Leu Gin Met Arg He Arg Lys Gin Ala Gly Gly Val Leu Ala Leu 
1585 1590 1595 1600 

Asp Ala Ser Lys Thr Leu Asp Pro Arg Arg Pro Leu Lys Glu Tyr Gly 
1605 1610 1615 

Leu Asp Ser Leu Met Ala Leu Asp Leu Ala Arg Ala He Gly Glu Leu 
1620 1625 1630 

Val Arg Lys Ser Leu Pro Ala Thr Leu Leu Tyr Asp His Pro Thr Val 
1635 1640 1645 

Glu Lys Leu Ala Gly His Val Leu Arg Glu Leu Gly Leu Asp Val Pro 
1650 1655 1660 

Ser Asp Ser Leu Val Asp Glu Val Arg Gin Leu Ser Glu Gin Glu Met 
1665 1670 1675 1680 



Ala Ala Phe He Thr Glu Thr Leu His His Leu Gly Glu 
1685 1690 



Glu Arg 
1695 
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<210> 126 
<211> 1434 
<212> PRT 
<213> bacterie 

<400> 126 

Met Ser Asp Leu Thr Pro Leu Gin Gin Ala Val Leu Ala Leu Lys Arg 



Thr Arg Ala Arg Leu Asp Glu Leu Glu Ser Val His Asn Glu Pro lie 
20 25 30 

Ala lie Val Gly Met Ala Cys Arg Phe Pro Gly Ala Asp Ser Pro Glu 



Ala Phe Trp Gin Leu Leu His Asp Gly lie Asp Ala lie Arg Glu lie 
50 55 60 

Pro Ala Gly Arg Trp Asp Ala Asp Ala Phe Tyr Asp Pro Asp Pro Asn 
65 70 . 75 ■ 80 

Ala Pro Gly Lys Met Tyr Thr Arg Leu Gly Gly Phe Leu Asp Gly Ala 



Val Asp Gly Phe Asp Ala Gly Phe Phe Gly He Thr Pro Arg Glu Val 
100 105 110 

Ala Gly Leu Asp Pro Gin Gin Arg Leu Leu Leu Glu Val Ala Trp Glu 
115 120 125 

Ala Leu Glu Arg Ala Gly Arg Pro Pro Asp Ser Leu Ala Gly Ser Asp 
130 135 140 

Thr Gly Val Phe He Gly He Ser Thr Asp Asp Tyr Ser Arg Leu Lys 
145 150 155 160 

Pro Thr Asp Pro Ala Leu He Asp Ala Tyr Thr Gly Thr Gly Thr Ala 
165 170 175 

Phe Ser Thr Ala Ala Gly Arg He Ser Tyr Leu Leu Gly Leu Gin Gly 
180 185 190 

Pro Asn Phe Pro Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val 
195 ■ 200 205 

His Leu Ala Cys Arg Ser Leu Gin Ser Arg Glu Cys Ser Met Ala Leu 
210 215 220 

Ala Gly Gly Val Asn Leu He Leu Ala Pro Glu Ser Thr He Tyr Phe 
225 230 235 240 
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Cys Arg Leu Arg Ala Mec Ala Ala Asp Gly Arg Cys Lys Ser Phe Ala 
245 250 255 



Ala Ser Ala Asp Gly Tyr Gly Arg Gly Glu Gly Cys Gly Met Leu Val 
260 265 270 



Leu Lys Arg Leu Ser Asp Ala Thr Arg Asp Gly Asp Arg lie Leu Ala 
275 280 285 



Leu lie Arg Gly Ser Ala Val Asn His Gly Gly Arg Ser Asn Gly Leu 
290 295 300 



Thr Ala Pro Asn Gly Pro Ala Gin Glu Ala Val He Arg Ala Ala Leu 
305 310 315 320 



Lys Asn Ala Gly Met Ala Pro Ala Asp Val Asp Tyr Val Glu Ala His 
325 330 335 



Gly Thr Gly Thr Pro Leu Gly Asp Pro He Glu Leu Arg Ala Met Ala 
340 345 350 



Ala Val Leu Gly Glu Gly Arg Ala Val Asp Ser Pro Leu He Val Gly 
355 360 365 



Ser Val Lys Thr Asn Phe Gly His Leu Glu Ala Ala Ala Gly He Ala 
370 375 380 



Gly Leu He Lys Thr He Leu Ala Leu Gin His Arg Glu He Pro Pro 
385 390 395 400 



His Leu His Phe Asn Ala Pro Asn Pro His Val Leu Trp Asn Glu Leu 
405 410 415 



Pro Leu Lys He Ala Thr Ala Cys Ser Pro Trp Pro Ser Asn Gly Arg 
420 425 430 



Pro Arg Val Ala Gly Val Ser Ser Phe Gly He Ser Gly Thr Asn Ser 
435 440 445 



His Val Val Leu Ala Glu Ala Lys Thr Asn Val Glu Ala Lys Thr Asn 
450 455 460 



Val Glu Ala Lys Thr Asn Val Glu Ala Lys Thr Ser Glu Glu Val Lys 
465 470 475 480 



Ala Ser Val Glu Ala Lys Gly Asn Val Glu Ala Lys Ala Ser Ala Ser 
485 490 495 



Val Pro Leu Leu Glu Gly Asp Ser Arg Pro Arg Ser Gly Gly Gly Gly 
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Ser Gly Arg Pro Pro Ser Arg Glu Glu Val Pro Val Pro Asp Gin Leu 
515 520 525 

His Ala Glu Asp Gly Arg Glu Tyr Leu Leu Pro Leu Ser Ala Arg His 
530 535 540 

Pro Gin Ala Leu Arg Asp Leu Ala Gly Ala Tyr Arg Asp Gly Arg Phe 
545 550 555 560 

His Ala Pro Leu Ser Ala Leu Cys Ser Ala Ala Ser Leu Thr Arg Ser 
565 570 575 

His Tyr Glu His Arg Ala Ala Phe Val Ala Ser Ser Leu Pro Glu Phe 
580 585 590 

Asn Gin Leu Leu Glu Ala Phe Arg Arg Asn Glu Thr Asn Arg Gly Val 
595 600 605 

Ala Thr Gly Phe Ala Asp Pro Gly Val Arg Pro Lys Leu Ala Phe lie 

610 615 620 

Phe Ser Gly Gin Gly Gly Gin Tyr Pro Arg Met Ala Tyr Arg Leu Tyr 
625 630 635 640 

Ser Asp Glu Pro Val Phe Arg Ser Ala He Glu Arg Cys Asp Ala Ala 
645 650 655 

Phe Arg Ser Phe Val Glu Trp Arg Leu Ala Asp Leu Leu Ala Asp Glu 
660 665 670 

Ser Gly Ala Trp Leu Ser Gin He Asp Arg Val Gin Pro Ala Leu Phe 
675 680 685 

Ala Val Gin He Ala Leu Val Glu Leu Leu Gin Ser Trp Gly He Arg 
690 695 700 

Pro Asp Gly Val Ala Gly His Ser Met Gly Glu Val Ala Ala Ala His 
705 710 715 720 

Val Ala Gly He Leu Thr Leu Glu Asp Ala Ala Arg He He Cys Arg 
725 730 735 

Arg Ser Arg Leu Leu Leu Gly Leu Arg Gly Arg Gly Ala Met Ala Leu 
740 745 750 



Val Glu Leu Pro Leu Asp Arg Ala Lys Ala Val Leu Ala Glu Arg Gly 
755 760 765 
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144 



Leu Thr Thr Val Ser Val Ala Ala Ser Asn Gly Pro Arg Ser Thr Val 
770 775 780 

Phe Ser Gly Asp Arg Val Ala Leu Glu His Leu Lys Asp Asp Phe Glu 
785 790 795 800 

Arg Arg Gly Val Phe Cys Arg Leu He Gin Val Asp Val Ala Ser His 
805 810 815 

Ser Ser Gin Val Asp Pro Leu Glu Asn Glu Leu Arg Gin Glu Leu Gly 
820 825 830 

Arg Val He Ala Lys Arg Ser Ala Val Pro Phe Phe Ser Thr Val Glu 
835 840 845 

Gly Gin Leu Ser Thr Gly Glu Ala Cys Asp Ala Ser Tyr Trp Val Ala 
850 855 860 

Asn Leu Arg Gin Pro Val Arg Phe Trp Glu Ser Leu Gin Ala Met Ala 
865 870 875 880 

Gly Asp Glu Phe Thr Gin Phe Leu Glu He Ser Pro His Pro Val Leu 
885 890 895 

Thr Pro Ser He Glu Asp Ser Leu Arg Thr Leu Gly He Asn Gly Leu 
900 905 910 

Val Arg Pro Val Leu Arg Arg Asp Glu Pro Glu Arg Arg Glu Leu Leu 
915 920 925 

Glu Leu Leu Ala Ala Leu Tyr Val Asn Gly Gin Arg Pro Asp Trp Arg 
930 935 940 

Ala Leu Ala Ser Ser Pro Asp Thr Arg Leu Asp Leu Pro Thr Tyr Pro 
945 950 955 960 

Trp Gin Arg Glu Arg Phe Trp Phe Ala Thr Ser Thr Arg Arg Ser Leu 
965 970 975 

Pro Ala Val Gly Gly His Pro Leu Leu Gly Arg Lys Val Glu He Ala 
980 985 990 

Leu Ala Pro Asp Thr His Val Trp Glu Ser Val Leu Ser Leu Asp Ala . 
995 1000 1005 

Leu Pro Phe Leu Ala Asp His Arg Leu Asn Glu Leu Val Val Leu Pro 
1010 1015 1020 



Gly Ala Ala Tyr Val Glu Met Ala Leu Ala Ala Ala Lys Glu Val Phe 
1025 1030 1035 1040 
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Ala Gly Gly Cys Ser Leu Glu Glu He Arg Phe Glu Gin Met Leu Val 
1045 1050 1055 

Val Pro Ser Ala Gly Ala Ser Arg Val Gin Val He Leu Glu Gly His 
1060 1065 1070 

Ala Phe Arg He Ser Ser Leu Ala Glu Gly Gly Ser Asp Trp Thr Glu 
1075 1080 1085 

His Ala Arg Gly Thr Met Ala Ala Ala Pro Asp Lys Val Ala Pro Thr 
1090 1095 1100 

Val Ser Leu Pro Thr Leu Gly Asp Arg He Glu Gly Asp Asp Phe Tyr 
1105 1110 1115 1120 

Ala Ala Phe Ala Ser Gin Gly Met His Tyr Gly Asp Thr Phe Arg Gly 
1125 1130 1135 

He Ala Glu Val Trp Arg Arg Asp Gly Glu Ala Val Ala Arg Leu Ser 
1140 1145 1150 

Val Pro Asp Ala Val Arg Glu Ala Glu Ser Gly Tyr Thr Leu His Pro 
1155 1160 1165 

Ala Leu Leu Asp Ala Cys Leu Gin Val Leu Gly Ala Thr Leu Gly Gly 
1170 1175 1180 

Glu Gly Ser Ala Gly Pro Cys Val Pro Val Ala He Glu Arg Leu His 
1185 1190 1195 1200 

Cys Phe Gly Arg Pro Ala Gly Asp Leu Arg Val His Ala Arg Leu Thr 
1205 1210 1215 

Gly Arg Leu Glu Gly Asp Val Thr Leu Cys Asp Ala Glu Gly His Val 
1220 1225 1230 

He Leu Glu Val Gin Gly Leu Arg Ala Gin Glu Leu Glu Arg Gin Ser 
1235 1240 1245 

Glu Trp Phe His Ala Met Glu Trp Glu Pro Gin Leu Leu Ala Glu Ser 
1250 1255 1260 

Pro Thr Ala Thr Val Ser Gly Ala Trp Leu Val He Ala Asp Ala Gly 
1265 1270 1275 1280 

Gly He Ala Ala Ala Val Ala Arg Gly Leu Gly Thr Asn Thr Val Val 
1285 1290 1295 

He Ser Gly Arg Asp Ala Glu He Pro Asp Gin Pro Tyr Arg Gly Val 
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1300 1305 1310 

He His Cys Gly Ser Leu Asp Glu Thr Glu Asp Glu Thr Asp Pro Ser 
1315 1320 1325 

Ala Ala Gly Gly Thr Ala Cys Glu Asp He Leu Arg He Val Gin Glu 
1330 1335 1340 

Phe Gly Val Gly Arg He Gin Leu Thr Lys Gin Ala Ser Asp Ala Glu 
1345 1350 1355 1360 

Ser Gin His Pro Arg He Trp Leu He Thr Ala Gly Val His Ala Glu 
1365 1370 1375 

His Leu Gin Met Pro Val Val Pro Ala Arg Ala Pro Val Trp Gly Leu 
1380 1385 1390 

Gly Arg Thr He Ala Ala Glu His Pro Glu Phe Ala Cys Thr Cys He 
1395 1400 • 1405 

Asp Leu Asp Thr Ala Gly Glu Val Glu Val Gin Ala Leu Cys Arg Glu 
1410 1415 1420 

He Leu Ala Gly Ser Ser Glu Arg Gin Gly 
1425 1430 



